Skip to content

Latest commit

 

History

History
11 lines (11 loc) · 1.02 KB

README.md

File metadata and controls

11 lines (11 loc) · 1.02 KB

Breast-cancer-prediction

L'objectif de ce projet est d'appliquer différentes méthodes de sélection de caractéristiques sur le jeu de données ‘Wisconsin Diagnostic Breast Cancer’ afin d'améliorer la qualité de la prédiction de la variable cible. Les méthodes de sélection des caractéristiques sont les suivantes : sélection basée sur l'importance, RFEcv, sélection basée sur la corrélation de Pearson, sélection basée sur le gain d'information, et Relief plus une méthode de sélection basée sur l'algorithme du graphe DFS. Nous avons également utilisé six algorithmes d'apprentissage automatique : eXtreme Gradient Boosting (XGB), Gradient Boosting (GB), Gaussian Naive Bayes (GNB), Random Forest (RF), Logistique Regression (LR) et K-Nearest Neighbors (KNN). La validation croisée k-fold et la validation croisée stratifié k-fold pour valider les modèles obtenus. qui sont évalués à l'aide des mesures de performance standard, y compris l’accuracy, la sensibilité, la spécificité, le mcc et l’AUC.