Python HdpModel.suggested_lda_model примеры использования

Язык программирования: Python

Пространство имен/Пакет: gensim.models.hdpmodel

Класс/Тип: HdpModel

Метод/Функция: suggested_lda_model

Примеров на hotexamples.com: 1

Python HdpModel.suggested_lda_model - 1 пример найден. Это лучшие примеры Python кода для gensim.models.hdpmodel.HdpModel.suggested_lda_model, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

HdpModel(8)

print_topics(3)

evaluate_test_corpus(1)

hdp_to_lda(1)

load(1)

save(1)

show_topics(1)

suggested_lda_model(1)

Пример #1

Показать файл

Файл: hdp_driver.py Проект: ruanchaves/hdp

class HDP(object):
    def __init__(self, corpus, dct, df):
        self.dct = dct
        self.corpus = corpus
        self.model = HdpModel(corpus, dct)
        self.df = df
        self.lda = None
        self.topic_dist = None

    def build_lda(self):
        self.lda = self.model.suggested_lda_model()

    def build_topic_dist(self):
        self.topic_dist = []
        for lst in self.lda[self.corpus]:
            distr = np.array([0.0] * 150)
            for tup in lst:
                distr[tup[0]] = tup[1]
            self.topic_dist.append(distr)

    def jensen_shannon(self, query, matrix):
        p = query
        q = matrix
        m = 0.5 * (p + q)
        E1 = entropy(p, m)
        E2 = entropy(q, m)
        E = E1 + E2
        return np.sqrt(0.5 * E)

    def similarity(self, query, matrix, k=10):
        sims = []
        for index, item in enumerate(matrix):
            sims.append(self.jensen_shannon(query, matrix[index]))
        sims = np.array(sims)
        return sims.argsort()[:k]

    def similarity_query(self, index, k=10, n=2):
        bow = self.dct.doc2bow(self.df.iloc[index, n])
        doc_distribution = np.array([0.0] * 150)
        for tup in self.lda.get_document_topics(bow=bow):
            doc_distribution[tup[0]] = tup[1]
        return self.similarity(doc_distribution, self.topic_dist, k)