Breast-cancer-prediction

L'objectif de ce projet est d'appliquer différentes méthodes de sélection de caractéristiques sur le jeu de données ‘Wisconsin Diagnostic Breast Cancer’ afin d'améliorer la qualité de la prédiction de la variable cible. Les méthodes de sélection des caractéristiques sont les suivantes : sélection basée sur l'importance, RFEcv, sélection basée sur la corrélation de Pearson, sélection basée sur le gain d'information, et Relief plus une méthode de sélection basée sur l'algorithme du graphe DFS. Nous avons également utilisé six algorithmes d'apprentissage automatique : eXtreme Gradient Boosting (XGB), Gradient Boosting (GB), Gaussian Naive Bayes (GNB), Random Forest (RF), Logistique Regression (LR) et K-Nearest Neighbors (KNN). La validation croisée k-fold et la validation croisée stratifié k-fold pour valider les modèles obtenus. qui sont évalués à l'aide des mesures de performance standard, y compris l’accuracy, la sensibilité, la spécificité, le mcc et l’AUC.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Breast-cancer-prediction

Files

README.md

Latest commit

History

README.md

File metadata and controls

Breast-cancer-prediction