Il s'agit ici du résultat du second projet mené pendant ma formation à la Wild Code School.
Création d'un système de recommandation de films pour le compte d'un gérant de cinéma situé dans la Creuse afin de l'aider à selectionner des films pour ses clients locaux.
Appropriation et première exploration des données
Outils principaux : Pandas, Matplotlib, jupyterLab
LIEN DIAGRAMME DE RETRAVAIL DES TABLES 💪 🕺
Jointures, filtres, nettoyage, recherche de corrélation
Outils principaux : Pandas, Seaborn, DataPane, jupyterLab
LIEN ANALYSE DES DONNEES SOUS DATAPANE 💡 📊
Machine learning, recommandations
Outils principaux : scikit-learn, Streamlit, jupyterLab, GitHub
LIEN APPLICATION UTILISATEUR SOUS STREMLIT ⭐
Affinage, présentation et Demo Day Outils principaux : power-point, DataPane, Streamlit
-base IMDb
-Explication datasets
-API Omdb
- Nettoyage de l'ensemble des fichiers sources pour n'en former que deux :
- un premier très macro pour réaliser notre analyse,
- un second pour réaliser notre algorithme
-
Analyse de la base de données via le 1er fichier nettoyé : mise en forme de graphiques via datapane
-
Préparation de notre 2nd fichier nettoyé pour le machine learning : transformation en format pickle et split des colonnes non numériques
-
Tests de machine learning : normalisation des données et mise en place d'un algorithme basé sur les plus proches voisins (algorithme K-nearest neighbors (kNN))