Scraping: ¿la amenaza tecnológica detrás de los “sold out”?
En el 2022, mientras la economía global se enfrentaba a una desaceleración generalizada, la industria del entretenimiento en República Dominicana resurgió con grandes presentaciones artísticas de cantantes como Pablo Alborán, Coldplay o Bad Bunny. El revuelo económico de este último, que implicó boletas de hasta RD$26,900, incluyó “sold out” en menos de 24 horas y acusaciones de fraude.
Otros eventos multitudinarios que acapararon la atención fueron los deportivos. No faltaron los titulares que resaltaron el agotamiento de boleta en cuestión de horas, a través de las boleterías virtuales. Una posible respuesta ante ese acaparamiento de entradas en cuestión de minutos podría estar en el denominado “scraping”.
Se trata de una especie de “raspado” de sitios web que se lleva a cabo mediante el uso de programas informáticos automatizados, conocidos como “bots” o “spiders”, que navegan por la web y recopilan información de las páginas visitadas. Así lo explicó a elDinero la investigadora de seguridad en ESET Latinoamérica, Sol González.
De hecho, el término “sold out” volvió a los titulares luego de que los promotores artísticos de la cantante Ana Gabriel tuvieran que abrir una tercera función en el país tras vender todas las boletas, en lo que SD Concerts consideró “tiempo récord”. El lapso fue en menos de tres horas.
¿Agotadas o acaparadas?
El scraping no es algo nuevo, y aunque “no es en sí mismo un acto ilegal ni un delito, e incluso puede ser beneficioso en determinadas situaciones”, tal como detalla González, hay varios ejemplos de casos en los que ha sido utilizado de manera ilegal o dañina.
Un ejemplo es el caso en el que el sitio web Ticketmaster bloqueó más de seis millones de bots que intentaron comprar todas las entradas en tan solo minutos, señaló la experta. “Es una práctica bastante común”, agregó.
Según explica, existen múltiples aplicaciones legítimas para el scraping, como la recopilación de datos de precios para la comparación en línea, o de noticias para la creación de resúmenes automatizados y para análisis de mercado. Sin embargo, también se utiliza para actividades ilegales como sustracción de información personal para el robo de identidad.
Es así como el scraping abre una ventana y vuelve tanto rentable como atractivo el trabajo de revendedor, o como se conoce popularmente, “el mercado negro” de boletas de conciertos, ya que esas empresas dependen de obtener entradas atractivas a los mejores precios. Pero esa práctica puede ser todavía más peligrosa, porque se puede extender a otros sectores.
Otro ejemplo estaría en la plataforma de LinkedIn, que fue demandado por los usuarios de la red profesional, ya que el sitio web “scrapeaba” automáticamente información de sus perfiles para uso comercial sin su consentimiento.
Sectores
En Latinoamérica el scraping es una práctica cada vez más común, ya que cada vez hay más empresas y organizaciones que buscan recopilar datos para analizarlos y así mejorar sus operaciones, basadas en la información sustraída.
La práctica se ve impulsada por el aumento en la cantidad de información disponible en línea. “A medida que la tecnología avanza, se está volviendo cada vez más fácil y asequible para las organizaciones recopilar y analizar grandes cantidades de datos, lo que ha llevado a un aumento en la utilización de scraping”, explica González.
Se trata de una “herramienta” que puede ser utilizada para obtener información sobre el mercado financiero, como el precio de las acciones, las tasas de interés y las tendencias económicas. “Esta información puede ser utilizada para tomar decisiones informadas sobre inversiones y estrategias comerciales, lo que puede dar ventaja a los competidores”.
Por otro lado, el scraping también puede ser utilizado para recopilar datos de la banca en línea, como transacciones bancarias, saldo de cuentas, información de tarjetas de crédito, etc. “Esto puede llevar a fraudes financieros y robo de identidad”, advierte.
Aun así, es una práctica que puede ser detenida si se detecta que se está violando la privacidad o las regulaciones de protección de datos. “Es importante mencionar que existen leyes y regulaciones que prohíben el scraping de datos sin el consentimiento previo del propietario del sitio web, y las organizaciones pueden tomar medidas legales contra las personas u organizaciones que violen estas regulaciones”, aclara.
No obstante, es probable que continúe siendo una práctica común en el futuro. De hecho, alerta que es probable que se desarrollen nuevas tecnologías y herramientas que faciliten el scraping de datos de manera legal y segura, lo que podría llevar a un aumento en la utilización de esta técnica.
Medidas
Aunque que lo recomendable es consultar con un experto en seguridad y protección de datos para determinar cuál es la mejor opción para su sitio web, González explica que las empresas son quienes deben tomar medidas dentro de sus plataformas para evitar ser víctimas de esta modalidad. En ese sentido, comparte algunas medidas a tomar:
•Tecnologías anti-scraping: hay herramientas y soluciones de terceros disponibles que pueden ayudar a detectar y bloquear los intentos de scraping automatizado.
•CAPTCHAs: es una forma efectiva de evitar que los bots automatizados accedan a su sitio web.
• Autenticación de usuario: requerir que los usuarios se registren o inicien sesión antes de acceder a cierta información o funcionalidades es una forma efectiva de evitar el scraping automatizado.
• Protección de IP: bloquee las direcciones IP que se consideran maliciosas o que han intentado acceder a su sitio web de forma automatizada.
• Robots.txt: es un archivo que se encuentra en la raíz de un sitio web y que especifica qué rutas o páginas debe evitar un bot al visitar un sitio web.
• Headers HTTP: algunas técnicas de scraping automatizado se basan en la extracción de metadatos, por lo que puede agregar headers HTTP para indicar que su sitio web no debe ser indexado o raspado.
• Privacidad y política de uso: para evitar el scraping ilegal, es importante que los sitios web cuenten con una política de privacidad y una política de uso que establezcan claramente las condiciones de uso de la información y los datos del sitio web.
• Medidas legales: Si se detecta scraping ilegal, una opción es tomar medidas legales contra las personas o organizaciones que lo estén realizando.
Aplicaciones
Algunas industrias que pueden hacer uso del scraping son marketing para recopilar datos de precios y productos de sus competidores, así como para mejorar su estrategia de marketing.
En el caso del sector financiero, les ayuda a tomar decisiones informadas sobre inversiones y estrategias comerciales. En turismo para recopilar datos de precios de vuelos, hoteles y otros servicios y en salud les permite mejorar el diagnóstico y el tratamiento de enfermedades.
La entrada Scraping: ¿la amenaza tecnológica detrás de los “sold out”? se publicó primero en VisionRDN.