Skip to content

brunoschneider/mestrado_fgv_emap

Repository files navigation

mestrado_fgv_emap

Este repositório contém os scripts de aplicação desenvolvida como parte da dissertação de Mestrado em Modelagem Matemática da Informação na Escola de Matemática Aplicada (EMAP) da FGV-RJ.

Autor: Bruno Schneider

Título do trabalho: Visualização em multirresolução do fluxo de tópicos em coleções de texto

Data da defesa: 21 de março de 2014 às 14h, na Fundação Getúlio Vargas (FGV) | Praia de Botafogo, 190, sala 418 (RJ).

Resumo do trabalho:

O uso combinado de algoritmos para a descoberta de tópicos em coleções de documentos com técnicas orientadas à visualização da evolução daqueles tópicos no tempo permite a exploração de padrões temáticos em corpus extensos a partir de representações visuais compactas.

A pesquisa em apresentação investigou os requisitos de visualização do dado sobre composição temática de documentos obtido através da modelagem de tópicos – o qual é esparso e possui multiatributos – em diferentes níveis de detalhe, através do desenvolvimento de uma técnica de visualização própria e pelo uso de uma biblioteca de código aberto para visualização de dados, de forma comparativa. Sobre o problema estudado de visualização do fluxo de tópicos, observou-se a presença de requisitos de visualização conflitantes para diferentes resoluções dos dados, o que levou à investigação detalhada das formas de manipulação e exibição daqueles. Dessa investigação, a hipótese defendida foi a de que na impossibilidade de uso de uma única técnica para visualização do tipo de dado em estudo, tem-se que as oportunidades trazidas por ambientes interativos e por ferramentas abertas disponíveis em bibliotecas de visualização levam à solução de desenvolvimento de aplicações que façam uso integrado de mais de uma técnica de acordo com a resolução do dado. A descrição de uma solução para ambientes interativos através do uso de transições automáticas entre técnicas de acordo com a resolução de exploração do dado é a principal contribuição desse trabalho.

Palavras-chave: Visualização,Modelagem de tópicos, Latent Dirichlet allocation (LDA)

About

Scripts em Python da aplicação desenvolvida como parte da dissertação de mestrado da EMAP/FGV

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published