Qu'est-ce que l'ingénierie des données et la recherche de 10 millions d'ordinateurs portables Jupyter – Le vrai podcast Python

By | janvier 8, 2021

python pour débutant

Véritable logo Python

08 janv.2021 55m

Christopher Bailey
David Amos

Connaissez-vous le rôle que jouent les ingénieurs de données dans le paysage moderne de la science des données et de Python? L'ingénierie des données est une sous-discipline qui se concentre sur le transport, la transformation et le stockage des données. Cette semaine dans l’émission, David Amos est de retour et il a apporté un autre lot d’articles et de projets hebdomadaires de PyCoder.

Parallèlement à l'article de Real Python sur l'ingénierie des données, nous parlons d'un projet dans lequel les chercheurs ont téléchargé 10 millions de blocs-notes Jupyter à partir de Github pour recueillir des informations sur l'état actuel de la technologie de la science des données.

Nous discutons également d'un article sur la validation des données en Python avec le package Cerberus. Et cela nous a conduit à une conversation sur un ensemble de défis de codage de Advent of Code.

Nous couvrons également plusieurs autres articles et projets de la communauté Python, notamment la création de mon propre moteur d'échecs, le guide visuel de NumPy, une alternative gratuite et open-source à SAP, une bibliothèque pour travailler avec des fichiers STL et des objets 3D, et Python vraiment un goulot d'étranglement?

Les sujets:

  • 00:00:00 – Présentation
  • 00:01:51 – Qu'est-ce que l'ingénierie des données et est-ce bon pour vous?
  • 00:12:07 – Construire mon propre moteur d'échecs
  • 00:17:52 – Nous avons téléchargé 10000000 notebooks Jupyter depuis Github: voici ce que nous avons appris
  • 00:28:12 – Pleins feux sur le cours vidéo
  • 00:29:20 – Python est-il vraiment un goulot d'étranglement?
  • 00:34:01 – Validation des données en Python avec Cerberus
  • 00:39:04 – NumPy Illustrated: Le guide visuel de NumPy
  • 00:42:54 – erpnext: Alternative gratuite et Open Source à SAP
  • 00:48:49 – numpy-stl: Bibliothèque pour travailler avec des fichiers STL et des objets 3D
  • 00:54:54 – Merci et au revoir

Afficher les liens:

Qu'est-ce que l'ingénierie des données et est-ce bon pour vous? – Dans cet article, vous aurez un aperçu de la discipline de l'ingénierie des données. Vous apprendrez ce qui fait et ne fait pas partie du travail d'un ingénieur de données, avec qui les ingénieurs de données travaillent et pourquoi les ingénieurs de données jouent un rôle crucial dans de nombreux secteurs.

Construire mon propre moteur d'échecs – Ecrire votre propre moteur d'échecs est un excellent moyen d'explorer la complexité informatique et les aspects combinatoires de la programmation. Sans oublier que c'est assez amusant! Suivez cette réflexion sur la façon dont un codeur a créé son propre moteur d'échecs à partir de zéro.

Nous avons téléchargé 10 millions de blocs-notes Jupyter à partir de Github: voici ce que nous avons appris – L'équipe JetBrains Datalore a téléchargé dix millions de blocs-notes Jupyter et les a analysés pour déterminer les langues les plus populaires, les types de contenu dans les cellules des blocs-notes et la cohérence des blocs-notes peut être reproduit. C'est un regard fascinant sur les tendances de la technologie de la science des données!

Python est-il vraiment un goulot d'étranglement? – Python est lent. D'un certain point de vue, c'est. Mais quels sont les véritables goulots d'étranglement dans l'espace d'ingénierie des données / traitement des données, et comment Python se compare-t-il aux autres technologies lorsque ces facteurs sont pris en compte?

Validation des données en Python avec Cerberus – Grâce à un défi Advent of Code, l'auteur Hector Castro a été exposé au package Cerberus Python pour la validation des données. Obtenez une introduction rapide à Cerberus et découvrez la solution d'Hector à un défi Advent of Code dans cette lecture rapide mais informative.

NumPy Illustrated: Le guide visuel de NumPy – Ce guide illustré de NumPy est un excellent moyen d'apprendre NumPy ou de rafraîchir le paquet. Plein de bons outils visuels, ce tutoriel couvre toutes les bases et plus encore!

Projets:

Liens supplémentaires:


Tweet
Partager
Email

Améliorez vos compétences Python avec ces cours:

«Parcourir tous les épisodes