
Scraping des député·e·s de l’Assemblée Nationale.
Script pour scraper les député·e·s français (Nom, Région, Email, Groupe, Circonscription) depuis le site de l'Assemblée nationale.
Click to collapse/expand
Scraping-Deputes-France: Un outil simple et efficace pour récupérer automatiquement les informations publiques des députés français : Noms, Régions, Emails et Groupes parlementaires.
L'idée de ce projet est née d'un besoin simple : pouvoir récupérer facilement les emails des députés d'une région donnée pour leur envoyer des mails groupés, notamment dans un cadre politique ou citoyen. Que ce soit pour interpeller les élus sur une cause, faire des demandes officielles, ou simplement avoir accès aux coordonnées publiques, cet outil automatise cette tâche.
J'ai notamment utilisé Scraping-Deputes-France
dans le cadre du projet LettreCitoyenne-Narcotrafic, une initiative citoyenne visant à faciliter l'expression de l'opposition à la proposition de loi intitulée "Proposition de loi visant à sortir la France du piège du narcotrafic". Ce site permet aux citoyens de contacter directement leurs députés pour exprimer leurs préoccupations sur les implications de cette loi sur les libertés individuelles.
- 🔍 Scraping des députés : Récupération automatique des noms, emails, groupes et circonscriptions.
- 📍 Sélection par région : Possibilité de filtrer les résultats par région spécifique.
- 🚀 Multithreading : Accélération du scraping grâce à l'exécution parallèle.
- 📊 Affichage optimisé : Résultats sous forme de texte structuré ou tableau ASCII.
- 💾 Exportation : Option d'enregistrement des résultats dans un fichier.
Avant de commencer l'installation, assurez-vous de remplir les prérequis suivants.
-
Python 3: Assurez-vous que Python 3 est installé sur votre système.
-
Dépendances: Installez les bibliothèques requises via pip en utilisant le fichier
requirements.txt
.
⚠️ Note: Scraping-Deputes-France a été testé avec Python 3.11.10 sous Linux. Bien qu'il puisse fonctionner avec d'autres versions, la compatibilité n'est garantie que pour cette configuration.
- Cloner le dépôt via Git:
git clone https://github.com/franckferman/Scraping-Deputes-France.git
- Installation sans Git (téléchargement direct): Si vous ne souhaitez pas cloner tout le dépôt et avez juste besoin du script, vous pouvez le télécharger directement:
curl -O https://raw.githubusercontent.com/franckferman/Scraping-Deputes-France/stable/src/Scraping-Deputes-France.py
Assurez-vous d'adapter les commandes en fonction de la configuration de votre installation de Scraping-Deputes-France
.
Pour afficher l'aide complète et explorer les fonctionnalités du script:
python3 Scraping-Deputes-France.py --help
Tâche | Commande |
---|---|
Scraper les députés des régions par défaut (Île-de-France & PACA) | python3 Scraping-Deputes-France.py |
Scraper uniquement la région Bretagne | python3 Scraping-Deputes-France.py --region Bretagne |
Scraper plusieurs régions spécifiques | python3 Scraping-Deputes-France.py --region Bretagne Ile-de-France |
Lister toutes les régions valides | python3 Scraping-Deputes-France.py --list-regions |
Tâche | Commande |
---|---|
Récupérer uniquement les noms et emails | python3 Scraping-Deputes-France.py --fields nom,email |
Afficher les résultats sous forme de tableau ASCII | python3 Scraping-Deputes-France.py --table |
Afficher les emails sans formatage ni séparateurs | python3 Scraping-Deputes-France.py --fields email --barefields --no-separator |
Tâche | Commande |
---|---|
Activer le multithreading avec 5 threads | python3 Scraping-Deputes-France.py --threads 5 |
Définir un délai de 2 secondes entre les tentatives en cas d'échec | python3 Scraping-Deputes-France.py --retries 5 --delay 2 --timeout 15 |
Tâche | Commande |
---|---|
Sauvegarder les résultats dans un fichier texte | python3 Scraping-Deputes-France.py --output deputes.txt |
Sauvegarder uniquement les emails dans un fichier | python3 Scraping-Deputes-France.py --fields email --barefields --output emails.txt |
Vos contributions, retours et suggestions jouent un rôle essentiel dans l’amélioration continue de ce projet. Que ce soit pour signaler un problème, proposer une nouvelle fonctionnalité ou soumettre une amélioration, chaque contribution compte et est la bienvenue.
L'outil Scraping-Deputes-France
permet de récupérer des informations publiques disponibles sur le site de l'Assemblée nationale. Son utilisation doit impérativement respecter les lois et réglementations en vigueur dans votre pays ou région.
L'utilisation de cet outil est strictement interdite pour :
- Envoyer des emails de masse non sollicités (spam) aux députés.
- Harceler, menacer ou nuire à toute personne ou entité.
- Mener des actions illégales telles que la collecte abusive de données ou leur diffusion sans consentement légal.
- Automatiser du lobbying abusif ou fausser le débat démocratique par des actions coordonnées non transparentes.
Le créateur de Scraping-Deputes-France
ne saurait être tenu responsable de toute utilisation abusive ou illégale de cet outil. En téléchargeant et en exécutant ce script, vous assumez l'entière responsabilité de votre usage et vous engagez à respecter les lois en vigueur.
🔹 En utilisant Scraping-Deputes-France, vous reconnaissez avoir lu, compris et accepté cette clause de non-responsabilité.
Découvrez l’évolution des étoiles attribuées à ce projet et suivez sa croissance au fil du temps:
Chaque étoile compte. Merci pour votre soutien. Vos encouragements nourrissent notre motivation et contribuent à l’évolution du projet. ✨
Ce projet est sous licence GNU Affero General Public License, Version 3.0 (AGPL-3.0). Pour plus de détails, veuillez consulter le fichier de licence dans le dépôt: Read the license on GitHub