Python SentenceSimilarity.LsiModel 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: sentenceSimilarity

클래스/타입: SentenceSimilarity

메소드/함수: LsiModel

hotexamples.com에서의 예제들: 2

Python SentenceSimilarity.LsiModel - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 sentenceSimilarity.SentenceSimilarity.LsiModel에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

set_sentences(12)

SentenceSimilarity(10)

TfidfModel(8)

similarity(7)

similarity_k(3)

restore_model(2)

LsiModel(2)

similarityK(1)

similarityArray(1)

similarity2(1)

FasttxModel(1)

save_model(1)

LdaModel(1)

mysimilarity(1)

MYsimilarity2(1)

MYsimilarity(1)

similarity_top_k(1)

예제 #1

파일 보기

파일: demo.py 프로젝트: L1Uc/SentenceSimilarity

    # 读入后半部分语料
    file_obj = FileObj(r"sentence2.txt")
    train_sentences = file_obj.read_lines()

    # 读入前半部分语料
    file_obj = FileObj(r"sentence1.txt")
    test1_sentences = file_obj.read_lines()
    # 分词工具，基于jieba分词，加了一次封装，主要是去除停用词
    seg = Seg()

    # 生成模型
    ss = SentenceSimilarity(seg)
    ss.set_sentences(train_sentences)
    #ss.TfidfModel()         # tfidf模型
    ss.LsiModel()  # lsi模型
    #ss.LdaModel()         # lda模型

    # 计算句子相似度
    # for i in range(0,len(train_sentences)/100):
    # mysims = ss.mysimilarity(test1_sentences[i*100])
    # # 每一百行为一个整体
    # sims_divided = mysims[i*100:(i+1)*100]
    # # 对一百行内的相似度进行排序
    # sort_sims = sorted(enumerate(sims_divided),key = lambda item : -item[1])
    # # 选择前五个最高的相似度进行输出
    # chosen_sims = sort_sims[:5]
    # for j in range(0,5):
    # print str(chosen_sims[j][0]) + " score:" + str(chosen_sims[j][1])

    for i in range(0, len(train_sentences) / 100):

예제 #2

파일 보기

import threading
file_obj = FileObj(r"dataSet/train_q.txt")
train_sentences = file_obj.read_lines()
with open("dataSet/train_a.txt", 'r', encoding='utf-8') as file_answer:
    line = file_answer.readlines()

seg = Seg()

# 训练模型
ss1 = SentenceSimilarity(seg)
ss1.set_sentences(train_sentences)
ss1.TfidfModel()  # tfidf模型

ss2 = SentenceSimilarity(seg)
ss2.set_sentences(train_sentences)
ss2.LsiModel()  # LSI模型


def tfidf_model(sentence):
    top = ss1.similarity(sentence)
    answer_index = top[0][0]
    answer = line[answer_index]
    return top[0][1], answer


def lsi_model(sentence):
    top = ss2.similarity(sentence)
    answer_index = top[0][0]
    answer = line[answer_index]
    return top[0][1], answer