Skip to content

mar71ns/ASSIN-UFV

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ASSIN-UFV

Este repositório são os arquivos gerados a partir do trabalho de dissertação de mestrado, apresentado à Universidade Federal de Viçosa.

Mestrando: Gustavo Soares Martins.

Orientador: Alcione de Paiva Oliveira.

Arquivos:

O Corpus ASSIN é dividido em 6 arquivos. 3 são em idioma 'ptbr' e 3 em 'ptpt'.

Paraca cada idioma há um arquivo train, dev e test.

Ex: nome_arquivo = 'assin-ptbr-train'

Para cada um dos 6 arquivos do corpus original foram gerados:  

  1. Arquivo com os valores do pré-processamento (nome_arquivo + '-processed.json')
  2. Arquivo com os labels para a tarefa de Similaridade Semântica (nome_arquivo + '-labels.json')
  3. Arquivo com os labels para a tarefa de Inferência Textual (nome_arquivo + '-labels-classifiers.json')
  4. Arquivo com os resultados dos modelos para a tarefa de Similaridade Semântica (nome_arquivo + '-results.txt')
  5. Arquivo com os resultados dos modelos para a tarefa de Inferência Textual (nome_arquivo + '-results-classifier.txt')

 

  • O arquivo 1 possui os valores de diversas features geradas sobre cada par de frases do corpus.
  • Os arquivos 2 e 3 são utilizados para o aprendizado supervisionado dos regressores e classificadores, respectivamente.
  • Os arquivos 4 e 5 contém a configuração dos modelos e seus resultados para cada tarefa.

obs: Para realizar o treinamento em ambas variações do corpus fora criado o arquivo 'assin-train' com os respectivos labels dos itens 2 e 3.

Modo de uso:

Os scripts foram criados e executados utilizando Python 3.7.4.

Para executar os arquivos classificadores.py e regressores.py é necessário instalar algumas bibliotecas disponíveis no requirements.txt. Dentro do arquivo insira o nome dos arquivos de treinamento e teste, respectivamente denominados file_train e file_test.

ex:

file_train = "assin-ptbr-train"

file_test = "assin-ptbr-dev"

Para rodar utilize o comando python e o script desejado.

Os resultados encontrados serão adicionados ao arquivo de resultado de acordo com a tarefa e o corpus utilizado para o teste.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages