Fractionnement des ensembles de données avec scikit-learn et train_test_split() – Real Python – Formation Python, php, javascript et référencement web

Formation Python

L'évaluation et la validation des modèles sont l'un des aspects clés de l'apprentissage automatique supervisé. Lorsque vous évaluez les performances prédictives de votre modèle, il est essentiel que le processus soit impartial. À l'aide de train_test_split() à partir de la bibliothèque de science des données scikit-learn, vous pouvez diviser votre ensemble de données en sous-ensembles qui minimisent le potentiel de biais dans votre processus d'évaluation et de validation.

Dans ce cours, vous apprendrez :

Pourquoi vous devez diviser votre jeu de données en machine learning supervisé
Lequel sous-ensembles de l'ensemble de données dont vous avez besoin pour une évaluation impartiale de votre modèle
Comment utiliser train_test_split() pour diviser vos données
Comment combiner train_test_split() avec méthodes de prédiction

De plus, vous obtiendrez des informations sur les outils connexes à partir de sklearn.model_selection.

[ad_2]

Formation Python

Partager :

Articles relatifs: