Ce projet nécessite d'avoir assimilé l'ensemble des notions du premier module du cours de science des données biologiques 3. Il correspond au dépôt GitHub https://github.com/BioDataScience-Course/C01Ib_lda
Ce projet est individuel court et cadré. Vous devrez :
- créer un classifieur
- tester ce classifieur
- utiliser les métriques de performance
-
Complétez les zones manquantes dans le carnet de notes
biodeg_notebook.qmd
. -
Assurez-vous à la fin que vous pouvez compiler une version HTML du fichier
biodeg_notebook.qmd
(bouton 'Rendu') sans erreurs. Sinon, corrigez-les avant soumission finale. N'utilisez pas l'argumentecho=FALSE
dans vos chunks. Le code R qui génère les résultats doit rester visible dans la version HTML. -
Utilisez les outils de vérification mis à votre disposition (onglet 'Construire' -> bouton 'Construire tout') toujours après avoir refait un rendu du document sinon, les informations présentées dans les tests ne seront pas à jour.
-
Enfin, vérifiez que votre dernier commit + push est bien enregistré sur GitHub à la fin de l'exercice.
Les données et les métadonnées sont à disposition sur le site de l'UC Irvine Machine Learning Repository :
Elles ont été employées dans le cadre de la publication suivante :