-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Erreur (sans message) si mauvais encodage fichier #34
Comments
@AurelienC Normalement un ancien commit gérait ce cas eed4ca3 😢 |
On a besoin d'avoir aadsm/jschardet#75 et aadsm/jschardet#87 dans une dépendance |
@AurelienC Penses-tu que l'on doive accepter des contributions où l'encodage n'est pas UTF-8 ? Ça pourrait poser des problèmes |
@AntoineAugusti Cela me semble correct de n'accepter que l'encodage UTF-8 et d'éviter d'avoir une BNLC une fois en UTF-8, une fois en ISO-8859-1, etc. |
Un autre fichier provoque la même erreur dans l'outil Contribuer. Il semble bien au format UTF-8, mais l'outil schema.data.gouv.fr affiche une erreur lors de la lecture en UTF-8. Si le fichier est ouvert en UTF-8, non modifié et enregistré en UTF-8 avec LibreOffice Calc, cette fois-ci, plus d'erreurs. Je suis en attente du logiciel utilisé par le contributeur. Serait-il possible d'ajouter une sorte de try/catch qui englobe l'ensemble pour afficher une erreur à l'utilisateur systématiquement @AntoineAugusti ? Le fichier BNLC.csv |
@AurelienC Ça te conviendrait ? |
Oui, très bien, merci @AntoineAugusti ! |
Hello @AurelienC! Je suis en train de tester la PR d'Antoine et je note ceci: Concernant le fichier qui est linké dans #34 (comment), il y a bien des caractères "non UTF-8" dedans vers la fin (voir le
Même en le passant dans LibreOffice et en sauvant je crois que ça reste en place (en tout cas sur un test ici!) donc il faudra s'assurer que ça ne pollue pas la base! On peut en reparler et vérifier que tout est d'équerre sur la dernière version de la donnée proposée. |
@AurelienC @AntoineAugusti c'est en cours de déploiement ! |
Lorsqu'un utilisateur charge un fichier CSV avec un mauvais encodage (dans le cas rencontré, encodage ISO-8859-1 au lieu de UTF-8), l'utilisateur ne voit aucun message d'erreur et ne peut pas passer à l'étape suivante. Il y a cependant un message dans la console du navigateur. (fichier export_covoit_eure.csv)

export_covoit_eure.csv
Si le fichier est converti en UTF-8, l'outil fonctionne correctement. (fichier : export_covoit_eure_utf8.csv)

export_covoit_eure_utf8.csv
Le validateur schema.data.gouv.fr arrive, quant à lui, à lire le fichier encodé en ISO-8859-1.

The text was updated successfully, but these errors were encountered: