Por qué el web scraping es vital para la democracia



Los frutos del raspado web, el uso de código para recopilar datos e información de sitios web, están a nuestro alrededor.

La gente construye raspadores que pueden encuentra todos los Applebee’s del planeta o recopilar la legislación y los votos del Congreso o seguimiento de relojes de lujo en venta en sitios web de fans. Las empresas utilizan raspadores para administrar su inventario minorista en línea y monitorear precios de la competencia. Muchos sitios conocidos usan raspadores para hacer cosas como realizar un seguimiento de los precios de los billetes de avión y listado de trabajos. Google es esencialmente un raspador web gigante y rastrero.

Los raspadores también son herramientas de los perros guardianes y los periodistas, por lo que The Markup presentó una amicus breve en un caso ante la Corte Suprema de Estados Unidos esta semana que amenaza con ilegalizar el raspado.

El caso en sí …Van Buren contra Estados UnidosNo se trata de raspar, sino de una cuestión legal sobre el enjuiciamiento de un oficial de policía de Georgia, Nathan Van Buren, que fue sobornado para buscar información confidencial en una base de datos policial. Van Buren fue procesado en virtud de la Ley de Abuso y Fraude Informático (CFAA), que prohíbe el acceso no autorizado a una red informática, como la piratería informática, cuando alguien irrumpe en un sistema para robar información (o, como se dramatizó en la película clásica de los años 80 «Juegos de guerra, ”Potencialmente comenzará la Tercera Guerra Mundial).

En el caso de Van Buren, dado que se le permitió acceder a la base de datos para trabajar, la pregunta es si el tribunal definirá ampliamente sus actividades preocupantes como «exceder el acceso autorizado» para extraer datos, que es lo que lo convertiría en un delito según la CFAA. Y es esa definición la que podría afectar a los periodistas.

O, como dijo el juez Neil Gorsuch durante los argumentos orales del lunes, conducir en la dirección de «quizás convertirnos a todos en un criminal federal».

Los periodistas de investigación y otros perros guardianes a menudo usan raspadores para iluminar temas grandes y pequeños, desde seguimiento de la influencia de los cabilderos en Perú recolectando los registros digitales de visitantes para que los edificios gubernamentales seguimiento y recolección anuncios políticos en Facebook. En ambos casos, las páginas y los datos extraídos están disponibles públicamente en Internet, sin necesidad de piratería, pero los sitios involucrados podrían cambiar fácilmente la letra pequeña de sus términos de servicio para etiquetar la agregación de esa información como «no autorizada». Y la Corte Suprema de EE. UU., Dependiendo de cómo dictamine, podría decidir que violar esos términos de servicio es un delito según la CFAA.

“Un estatuto que permita a fuerzas poderosas como el gobierno o actores corporativos adinerados criminalizar unilateralmente las actividades de recolección de noticias bloqueando estos esfuerzos a través de los términos de servicio para sus sitios web violaría la Primera Enmienda”, escribió The Markup en nuestro informe.

¿Qué tipo de trabajo está en riesgo? A continuación, se muestra un resumen de algunos trabajos periodísticos recientes que el raspado web hizo posible:

  • los Proyecto de seguimiento COVID, de The Atlantic, recopila y agrega datos de todo el país a diario, lo que sirve como un medio para monitorear dónde se realizan las pruebas, dónde está creciendo la pandemia y las disparidades raciales en cuanto a quién contrae y muere a causa del virus.
  • Esta proyecto, de Reveal, eliminó los grupos extremistas de Facebook y comparó sus listas de miembros con las de los grupos policiales en Facebook, y encontró mucha superposición.
  • La reciente investigación de Markup sobre los resultados de búsqueda de Google encontró que constantemente favorece sus propios productos, dejando algunos sitios web de los que el propio gigante web extrae información que luchan por los visitantes y, por lo tanto, los ingresos por publicidad. Departamento de Justicia de los Estados Unidos citó el problema en una demanda antimonopolio contra la empresa.
  • En Copiar, pegar, legislar, USA Today encontró un patrón de leyes moldeadas, impulsadas por grupos de intereses especiales, que circulaban en las legislaturas de todo el país.

Este articulo fue publicado originalmente en The Markup y fue reeditado bajo el Creative Commons Reconocimiento-No comercial-Sin derivados licencia.



Fuente: TNW

Compartir:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para fines de afiliación y para mostrarte publicidad relacionada con tus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Al hacer clic en el botón Aceptar, aceptas el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Ver Política de cookies
Privacidad