Outils, techniques et légalité – Le vrai podcast Python

By | juin 5, 2020

Formation gratuite Python

Real Python Logo

05 juin 2020 50m

Christopher Bailey
Navire Kimberly

Voulez-vous commencer avec le scraping Web en utilisant Python? Êtes-vous préoccupé par les implications juridiques potentielles? Quels sont les outils nécessaires et quelles sont les meilleures pratiques? Cette semaine, sur l'émission, nous avons Kimberly Fessel pour discuter de son excellent tutoriel créé pour PyCon 2020 en ligne intitulé «C'est officiellement légal, alors raclons le Web».

Nous discutons de la mise en route du grattage Web et couvrons les outils et techniques. Kimberly donne des conseils sur la recherche d'éléments à l'intérieur du html et sur les techniques de nettoyage de vos données. Elle note également un récent changement dans le paysage juridique concernant le raclage du Web.

Kimberly est scientifique principale des données au Metis Data Science Bootcamp à New York. Elle est titulaire d'un doctorat. en mathématiques appliquées. Nous parlons de son passage du monde universitaire à la science des données et discutons de sa passion pour la narration de données et les visualisations.

Les sujets:

  • 00:00:00 – Présentation
  • 00:01:31 – Expérience de Kimberly et Bootcamp Metis Data Science
  • 00:02:19 – PNL et travail dans la publicité
  • 00:03:27 – Changements dans la légalité du grattage Web
  • 00:06:12 – Quels sont les bons projets pour le web scraping?
  • 00:06:56 – Outils pour commencer le scraping web
  • 00:07:51 – Comment trouver les éléments que vous voulez?
  • 00:09:00 – Combien de code HTML devez-vous connaître?
  • 00:10:49 – Inspection des éléments dans le navigateur
  • 00:14:30 – Quels sont les bons sites pour s'entraîner?
  • 00:16:20 – Pause entre les demandes
  • 00:19:02 – Enregistrer au fur et à mesure
  • 00:20:54 – Pleins feux sur le cours vidéo Real Python
  • 00:21:55 – Naviguer dans le DOM
  • 00:23:10 – Nettoyage et formatage des données
  • 00:28:26 – Sites dynamiques et sélénium
  • 00:32:16 – Scrapy
  • 00:33:55 – PyOhio 2020
  • 00:35:40 – Transition hors du milieu universitaire
  • 00:38:40 – Qu'est-ce qui vous passionne dans le monde de Python?
  • 00:41:05 – Que voulez-vous apprendre ensuite en Python?
  • 00:48:00 – Qu'est-ce qu'une astuce ou un truc Python moins connu?
  • 00:49:17 – Merci et au revoir

Afficher les liens:

Détour par la cartographie Javascript:


Tweet
Partager
Email

Améliorez vos compétences en Python avec ces cours:

«Parcourir tous les épisodes