Python 3, pip.
pip install -r requirements.txt
-
Récupérer les fichiers des barèmes IPP au format XSLX
-
Facultatif: Préprocésser le fichier pour tenter d'ajouter les headers manquants:
./preprocess.py baremes-ipp-prelevements-sociaux-social-security-contributions.xlsx preprocessed_baremes.xlsx
Cette étape peut ajouter les headers standards si les étiquettes situées en deuxième ligne sont standards (par exemple,
"Date d'effet"
pourdate
). Il ne permet pas d'ajouter un header pour les colonnes de paramètres.
- Parser le fichier:
./parse_xlsx.py path/to/xslx/file/or/directory path/to/output/
-
La feuille contenant le sommaire du fichier doit contenir le mot clé "sommaire"
-
La première ligne (cachée à la visialisation) est un header optionnel qui peut contenir:
- Soit l'identifiant CSV du paramètre de la colonne.
- Soit un des mots clés suivant:
date
,reference
,notes
,date_parution_jo
- Soit un identifiant d'un champs libre de métadonnée
metadata/nom_du_champs
-
Il doit exister une colonne
date
, dont les valeurs sont de type date.- À la première valeur nulle ou d'au autre type dans la colonne date, le parseur ignore la ligne et toutes celles qui suivent.
- S'il n'y a pas de colonne nommée
date
, la feuille sera ignorée, avec warning.