Ce modèle de l'apprentissage consiste de découper des décisions jurisprudences en macro (Entête, Expose litige, Motif de la décision, Dispositif) et en micro (des arguments Sous motif de la décision) il est basé sur l'algorithme de RNN en utilisent LSTM Bidirectional
conda create -n textseg_3 python=3.7 numpy scipy gensim ipython
source activate textseg_3
pip3 install torch tqdm pathlib2 segeval tensorboard_logger flask
pip3 install nltk pandas xlrd xlsxwriter termcolor flask_wtf
Le dataset est constitué sur la base des régles réguliere dans data-processing/DataProcessing.py plus un filtrage à partir d'un seuil de 6 répture on considérer que la désicion est est un bon exemple pour l'apprentissage
Ajouter le chemin vres le DataSet d'apprentissage dans le fichier configgenerator.py et puis exécuter :
python3 configgenerator.py
python3 run.py --cuda --model max_sentence_embedding
python3 test_accuracy.py --cuda --model Model-data-5517/Meilleur_model.t7
python3 visualize_model_seg.py --model Model-data-5517/Meilleur_model.t7 --file webapp/Fpath_Testing.txt --output webapp/out/
--file
: Contient les chemins vres décisions à découper
--output
: Contiendra les décisions découpé
Le volume de dataset pour l'apprentissage pose un probléme de mémoire GPU CUDA insuffisant RuntimeError: cuda runtime error : out of memory
quand le Batch est élever