Segmentation de décision avec l'apprentissage supervisé

Ce modèle de l'apprentissage consiste de découper des décisions jurisprudences en macro (Entête, Expose litige, Motif de la décision, Dispositif) et en micro (des arguments Sous motif de la décision) il est basé sur l'algorithme de RNN en utilisent LSTM Bidirectional

Créer l'environnement :

conda create -n textseg_3 python=3.7 numpy scipy gensim ipython 
source activate textseg_3
pip3 install torch tqdm pathlib2 segeval tensorboard_logger flask  
pip3 install nltk pandas xlrd xlsxwriter termcolor flask_wtf

Exécuter le processus d'apprentissage :

Dataset constitué sur la base des Regex

Le dataset est constitué sur la base des régles réguliere dans data-processing/DataProcessing.py plus un filtrage à partir d'un seuil de 6 répture on considérer que la désicion est est un bon exemple pour l'apprentissage

PATH DataSet :

Ajouter le chemin vres le DataSet d'apprentissage dans le fichier configgenerator.py et puis exécuter :

python3 configgenerator.py

Lancer l'apprentissage :

python3 run.py --cuda --model max_sentence_embedding

Évaluer le modèle :

python3 test_accuracy.py --cuda --model Model-data-5517/Meilleur_model.t7

Exécuter le modèle sur des décisions :

python3 visualize_model_seg.py --model Model-data-5517/Meilleur_model.t7 --file webapp/Fpath_Testing.txt --output webapp/out/

--file: Contient les chemins vres décisions à découper

--output: Contiendra les décisions découpé

Les problémes rencontré :

Le volume de dataset pour l'apprentissage pose un probléme de mémoire GPU CUDA insuffisant RuntimeError: cuda runtime error : out of memory quand le Batch est élever

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
Model-data-5517		Model-data-5517
Model-data		Model-data
Model-micros-z		Model-micros-z
Model-z4-macros		Model-z4-macros
checkpoints		checkpoints
data-processing		data-processing
models		models
usage_memory		usage_memory
webapp		webapp
README.md		README.md
accuracy.py		accuracy.py
cating.sh		cating.sh
choi_convertor.py		choi_convertor.py
choiloader.py		choiloader.py
config.json		config.json
configgenerator.py		configgenerator.py
evaluate.py		evaluate.py
gpu2cpu.py		gpu2cpu.py
memory_.log		memory_.log
nohup.out		nohup.out
profiler.log		profiler.log
run.py		run.py
seg_comparsion.py		seg_comparsion.py
test_accuracy.log		test_accuracy.log
test_accuracy.py		test_accuracy.py
test_accuracy_choi.py		test_accuracy_choi.py
tests.py		tests.py
text_manipulation.log		text_manipulation.log
text_manipulation.py		text_manipulation.py
times_profiler.py		times_profiler.py
usage.training.log		usage.training.log
utils.py		utils.py
visualize_model_seg.py		visualize_model_seg.py

HSabbar/decision-segmentation

Folders and files

Latest commit

History

Repository files navigation

Segmentation de décision avec l'apprentissage supervisé

Créer l'environnement :

Exécuter le processus d'apprentissage :

Dataset constitué sur la base des Regex

PATH DataSet :

Lancer l'apprentissage :

Évaluer le modèle :

Exécuter le modèle sur des décisions :

Les problémes rencontré :

About

Resources

Stars

Watchers

Forks

Languages