Skip to content

CamilleMagnette/Movies_recommendation_with_machine_learning

Repository files navigation

🎥 Movies_recommendation_with_machine_learning

Il s'agit ici du résultat du second projet mené pendant ma formation à la Wild Code School.

🎯 Objectif du projet :

Création d'un système de recommandation de films pour le compte d'un gérant de cinéma situé dans la Creuse afin de l'aider à selectionner des films pour ses clients locaux.

✅ Etapes :

Semaine 1 :

Appropriation et première exploration des données
Outils principaux : Pandas, Matplotlib, jupyterLab

LIEN DIAGRAMME DE RETRAVAIL DES TABLES 💪 🕺

Semaine 2 et 3 :

Jointures, filtres, nettoyage, recherche de corrélation
Outils principaux : Pandas, Seaborn, DataPane, jupyterLab

LIEN ANALYSE DES DONNEES SOUS DATAPANE 💡 📊

Semaine 4 :

Machine learning, recommandations
Outils principaux : scikit-learn, Streamlit, jupyterLab, GitHub

LIEN APPLICATION UTILISATEUR SOUS STREMLIT ⭐ ♥️

Semaine 5 :

Affinage, présentation et Demo Day Outils principaux : power-point, DataPane, Streamlit

LIEN PRESENTATION

🎬 Source des données :

-base IMDb
-Explication datasets
-API Omdb

📎 Méthodologie technique :

  1. Nettoyage de l'ensemble des fichiers sources pour n'en former que deux :
  • un premier très macro pour réaliser notre analyse,
  • un second pour réaliser notre algorithme
  1. Analyse de la base de données via le 1er fichier nettoyé : mise en forme de graphiques via datapane

  2. Préparation de notre 2nd fichier nettoyé pour le machine learning : transformation en format pickle et split des colonnes non numériques

  3. Tests de machine learning : normalisation des données et mise en place d'un algorithme basé sur les plus proches voisins (algorithme K-nearest neighbors (kNN))

  4. Mise en place de l’application utilisateur Streamlit

  5. Publication de l'interface utilisateur Streamlit