Python TextProcessor.similarity_analysis示例

编程语言: Python

命名空间/包名称: processor

类/类型: TextProcessor

方法/功能: similarity_analysis

hotexamples.com的示例: 1

Python TextProcessor.similarity_analysis - 已找到1个示例。这些是从开源项目中提取的最受好评的processor.TextProcessor.similarity_analysis现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

TextProcessor(4)

get_top_ind(2)

build_doc_matrix(1)

calculateConditionalFrequency(1)

consine_similarity(1)

gen_matrix(1)

map_data(1)

map_json_data(1)

process(1)

process_doc(1)

similarity_analysis(1)

示例#1

显示文件

文件： similarity.py 项目： chena/text-proc-craig

def find_similar_pairs(data):
    """
	Find the most similar document for each document in the collection, output the pairs
	"""
    processor = TextProcessor()
    processor.map_json_data(data)
    similar_pairs = processor.similarity_analysis()
    data_output = {
        processor.doc_collection[f].link: processor.doc_collection[s].link
        for f, s in similar_pairs
    }

    with open('similar_0817.json', 'w') as file_output:
        json.dump(data_output, file_output)