En este taller se mostrará de manera teórica-práctica sobre el uso del Web Scraping como herramienta para la obtención automatizada de información desde sitios web. Se analizará cómo la mayoría de los datos disponibles en internet se encuentran en formato HTML no estructurado y cómo, mediante técnicas específicas, es posible transformarlos en datos analizables para aplicaciones en ciencia de datos, inteligencia de negocios, investigación académica y automatización de procesos.
Durante la sesión se explicará el proceso general del scraping: inspección de la estructura HTML de una página, identificación de etiquetas y patrones, obtención del contenido mediante peticiones HTTP y filtrado de información utilizando herramientas como Python, la librería requests y BeautifulSoup. Asimismo, se presentarán herramientas complementarias en entorno Linux para el análisis del tráfico y pruebas de peticiones HTTP.