ASSIN-UFV

Este repositório são os arquivos gerados a partir do trabalho de dissertação de mestrado, apresentado à Universidade Federal de Viçosa.

Mestrando: Gustavo Soares Martins.

Orientador: Alcione de Paiva Oliveira.

Arquivos:

O Corpus ASSIN é dividido em 6 arquivos. 3 são em idioma 'ptbr' e 3 em 'ptpt'.

Paraca cada idioma há um arquivo train, dev e test.

Ex: nome_arquivo = 'assin-ptbr-train'

Para cada um dos 6 arquivos do corpus original foram gerados:

Arquivo com os valores do pré-processamento (nome_arquivo + '-processed.json')
Arquivo com os labels para a tarefa de Similaridade Semântica (nome_arquivo + '-labels.json')
Arquivo com os labels para a tarefa de Inferência Textual (nome_arquivo + '-labels-classifiers.json')
Arquivo com os resultados dos modelos para a tarefa de Similaridade Semântica (nome_arquivo + '-results.txt')
Arquivo com os resultados dos modelos para a tarefa de Inferência Textual (nome_arquivo + '-results-classifier.txt')

O arquivo 1 possui os valores de diversas features geradas sobre cada par de frases do corpus.
Os arquivos 2 e 3 são utilizados para o aprendizado supervisionado dos regressores e classificadores, respectivamente.
Os arquivos 4 e 5 contém a configuração dos modelos e seus resultados para cada tarefa.

obs: Para realizar o treinamento em ambas variações do corpus fora criado o arquivo 'assin-train' com os respectivos labels dos itens 2 e 3.

Modo de uso:

Os scripts foram criados e executados utilizando Python 3.7.4.

Para executar os arquivos classificadores.py e regressores.py é necessário instalar algumas bibliotecas disponíveis no requirements.txt. Dentro do arquivo insira o nome dos arquivos de treinamento e teste, respectivamente denominados file_train e file_test.

ex:

file_train = "assin-ptbr-train"

file_test = "assin-ptbr-dev"

Para rodar utilize o comando python e o script desejado.

Os resultados encontrados serão adicionados ao arquivo de resultado de acordo com a tarefa e o corpus utilizado para o teste.

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
scripts		scripts
README.md		README.md
assin-ptbr-dev-labels-classifier.json		assin-ptbr-dev-labels-classifier.json
assin-ptbr-dev-labels.json		assin-ptbr-dev-labels.json
assin-ptbr-dev-processed.json		assin-ptbr-dev-processed.json
assin-ptbr-dev-results-classifiers.txt		assin-ptbr-dev-results-classifiers.txt
assin-ptbr-dev-results.txt		assin-ptbr-dev-results.txt
assin-ptbr-test-labels-classifier.json		assin-ptbr-test-labels-classifier.json
assin-ptbr-test-labels.json		assin-ptbr-test-labels.json
assin-ptbr-test-processed.json		assin-ptbr-test-processed.json
assin-ptbr-test-results-classifiers.txt		assin-ptbr-test-results-classifiers.txt
assin-ptbr-test-results.txt		assin-ptbr-test-results.txt
assin-ptbr-train-labels-classifier.json		assin-ptbr-train-labels-classifier.json
assin-ptbr-train-labels.json		assin-ptbr-train-labels.json
assin-ptbr-train-processed.json		assin-ptbr-train-processed.json
assin-ptpt-dev-labels-classifier.json		assin-ptpt-dev-labels-classifier.json
assin-ptpt-dev-labels.json		assin-ptpt-dev-labels.json
assin-ptpt-dev-processed.json		assin-ptpt-dev-processed.json
assin-ptpt-dev-results-classifiers.txt		assin-ptpt-dev-results-classifiers.txt
assin-ptpt-dev-results.txt		assin-ptpt-dev-results.txt
assin-ptpt-test-labels-classifier.json		assin-ptpt-test-labels-classifier.json
assin-ptpt-test-labels.json		assin-ptpt-test-labels.json
assin-ptpt-test-processed.json		assin-ptpt-test-processed.json
assin-ptpt-test-results-classifiers.txt		assin-ptpt-test-results-classifiers.txt
assin-ptpt-test-results.txt		assin-ptpt-test-results.txt
assin-ptpt-train-labels-classifier.json		assin-ptpt-train-labels-classifier.json
assin-ptpt-train-labels.json		assin-ptpt-train-labels.json
assin-ptpt-train-processed.json		assin-ptpt-train-processed.json
assin-train-labels-classifier.json		assin-train-labels-classifier.json
assin-train-labels.json		assin-train-labels.json
assin-train-processed.json		assin-train-processed.json
classificadores.py		classificadores.py
features-importance-similarity-classificador.txt		features-importance-similarity-classificador.txt
features-importance-similarity-regressor.txt		features-importance-similarity-regressor.txt
regressores.py		regressores.py
requirements.txt		requirements.txt

mar71ns/ASSIN-UFV

Folders and files

Latest commit

History

Repository files navigation

ASSIN-UFV

Este repositório são os arquivos gerados a partir do trabalho de dissertação de mestrado, apresentado à Universidade Federal de Viçosa.

Arquivos:

Modo de uso:

About

Resources

Stars

Watchers

Forks

Languages