Fractionnement des ensembles de données avec scikit-learn et train_test_split() – Real Python

By | août 31, 2021

Formation Python

L'évaluation et la validation des modèles sont l'un des aspects clés de l'apprentissage automatique supervisé. Lorsque vous évaluez les performances prédictives de votre modèle, il est essentiel que le processus soit impartial. À l'aide de train_test_split() à partir de la bibliothèque de science des données scikit-learn, vous pouvez diviser votre ensemble de données en sous-ensembles qui minimisent le potentiel de biais dans votre processus d'évaluation et de validation.

Dans ce cours, vous apprendrez :

  • Pourquoi vous devez diviser votre jeu de données en machine learning supervisé
  • Lequel sous-ensembles de l'ensemble de données dont vous avez besoin pour une évaluation impartiale de votre modèle
  • Comment utiliser train_test_split() pour diviser vos données
  • Comment combiner train_test_split() avec méthodes de prédiction

De plus, vous obtiendrez des informations sur les outils connexes à partir de sklearn.model_selection.

[ad_2]