# 283 Web scraping, l'édition 2020

By | septembre 23, 2020

Formation gratuite Python

Le scraping Web consiste à extraire le code HTML d'un site Web et à en analyser des données utiles. Les cas d'utilisation de ce type de fonctionnalité sont infinis. Vous avez un tas de données sur des sites gouvernementaux qui ne sont répertoriés qu'en ligne en HTML sans téléchargement? Il y a une API pour ça! Voulez-vous vous tenir au courant de ce que vos concurrents présentent sur leur site? Il existe une API pour cela. Besoin d'alertes pour les changements sur un site Web, par exemple, les inscriptions sont maintenant ouvertes dans votre collège et vous voulez être le premier à entrer et éviter le créneau de cours de 8h le lundi matin? Il existe une API pour cela.

Cette API est un grattage d'écran et Attila Tóth de ScrapingHub est là pour nous en dire plus.

Liens du spectacle

Attila Tóth sur LinkedIn: linkedin.com
Projet Scrapy: scrapy.org
Scrapinghub sur Twitter: @scrapinghub
Scrapinghub: scrapinghub.com
modèle cookiecutter pour les projets Scrapy: github.com
Splash: navigateur sans tête spécialement conçu pour le web scraping: scrapinghub.com/splash
Liste de raclage Web impressionnante: github.com

Parlez de l'épisode 50 de Python sur le web scraping: talkpython.fm
Comment le Web Scraping révèle le lobbying et la corruption au Pérou: blog.scrapinghub.com
Événement Web Data Extraction Summit: extraitsummit.io

Les sponsors

Parlez de la formation Python
Linode