IA - Análise de Discurso

Sistema

O sistema será desenvolvido usando uma combinação de softwares em Java e em Python, fazendo uso da biblioteca de processamento de linguagem natural NLTK e do pacote de manipulação de grafos networkx, entre outras tecnologias.

A maior parte do sistema roda automaticamente, o usuário não interage com os softwares em Java, e somente com três scripts em Python. Através desses scripts, podemos dividir o manuseio de dados em fases:

Objetivo

Preparação dos dados

Ao receber o discurso do paciente em formato “.txt” o programa faz um pré-processamento para remoção de stopwords, e depois realiza stemming:

Tokenização do texto: remoção de pontos, vírgulas, quebra de linhas, o, a, os, as;
Stemming: redução do termo ao seu radical.

Análise Emocional

Na análise de sentimentos, o programa tokeniza o texto por frases conforme o padrão do NLTK. Depois tokeniza cada uma das frases individualmente, gerando assim uma matriz de frases e palavras.

Após isso, estas frases são comparadas com o léxico para extrair o cunho emocional de palavras no texto em vetores de oito dimensões, uma para cada emoção: anger*,* anticipation*,* disgust*,* fear*,* joy,sadness*,* surprise*,* trust.

Parâmetros de IA

Para a análise, oito classificadores foram utilizados:

K- neighbors;
Support Vector Classifier (SVC);
Árvore de Decisão;
Random Forest;
MLP;
Gaussian NB;
QDA

Resultados

Todos devem dar um valor entre 0 (zero) e 1 (um) para cada frase que analisarem. Zero indica 100% de certeza que o paciente está doente, e um indica 100% de certeza que ele está saudável.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.gitignore		.gitignore
IA.py		IA.py
IAloader.py		IAloader.py
Prediction.py		Prediction.py
README.md		README.md
control.py		control.py
decisionTree.py		decisionTree.py
graph.java		graph.java
graph.py		graph.py
graph_generator.py		graph_generator.py
importNLTK.py		importNLTK.py
main.py		main.py
metrics.py		metrics.py
module.py		module.py
test.py		test.py

alsoDiego/IA_AnaliseDeDiscurso

Folders and files

Latest commit

History

Repository files navigation

IA - Análise de Discurso

Sistema

Objetivo

Preparação dos dados

Análise Emocional

Parâmetros de IA

Resultados

About

Resources

Stars

Watchers

Forks

Languages