Skip to content

Latest commit

 

History

History
28 lines (17 loc) · 1.35 KB

File metadata and controls

28 lines (17 loc) · 1.35 KB

Le notebook de rendu est "spanish_wine.ipynb"

Le dossier "data_explorer" contient des fonctions tests facilitant les différentes étapes du processus de prédiction dans le but de créer un package

Ma 1ère régression linéaire

Trouver un dataset sur kaggle permettant d'illustrer la régression linéaire multivariée

Référentiels

Certification RNCP Développeur.se en intelligence artificielle

Contexte du projet

Nous avont fait une série d'atelier introduisant gradullement la régression linéaire. Le repo Github est proposé en pièce jointe. Suite à cette série d'atelier, il est demandé aux apprenants de trouver sur la plateforme Kaggle un dataset prmettant d'illustrer la régression linéaire.

Modalités pédagogiques

Le projet se fera par groupe de 3 dans un délais de 1 mois

Livrables

Il devront produire dossier hébergé sur Github. Celui-ci devra contenir le dataset au format CSV et un notebook. Comme dans le dernier attelier, le notebook devra lui même contenir : - une partir de récupération et de cleaning de données - une partie découpage de données en deux dataset: un de training et un de testing. - une partie d'entrainement d'un modèle de régression linéaire faisant appelle à Scikit learn - une partie d'évaluation du modèle (sur le train et sur le test) - une proposition d'amélioration de ce score