Python RetrievalModel示例

编程语言: Python

命名空间/包名称: Phase_1

类/类型: RetrievalModel

hotexamples.com的示例: 5

Python RetrievalModel - 已找到5个示例。这些是从开源项目中提取的最受好评的Phase_1.RetrievalModel现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

CosineSimilarity(3)

BM25(1)

TFIDF(1)

示例#1

显示文件

文件： Task_2.py 项目： meghna-tulasi/Information-Retrieval

def retrieve_docs():
    snippet_generator = Snippet.SnippetGenerator(document_tokens,
                                                 stop_words_path)
    model = RetrievalModel.CosineSimilarity(N, inverted_index, document_tokens)
    ranked_list = model.cosine_similarity_list(query_dict)
    with open(query_expansion_table, "w") as file:
        csv_writer = csv.writer(file)
        updated_query_dict = {}
        for query_id, scores in ranked_list.items():
            updated_query = relevance_feedback_query(query_dict[query_id],
                                                     scores)
            updated_query_dict[query_id] = updated_query

        updated_list = model.cosine_similarity_list(updated_query_dict)
        for query_id, scores in updated_list.items():
            i = 0
            for score in scores:
                i += 1
                csv_writer.writerow(
                    (query_id, "Q0", score[0], i, score[1], "query_expansion"))
                if i == 1:
                    query = query_dict[query_id]
                    print("Given Query: " + query)
                    print("Top Document for given query: " + score[0])
                    print("Snippet: \n" +
                          snippet_generator.generate_snippet(score[0], query))
    file.close()

示例#2

显示文件

def retrieve_tf_idf__docs(snippet_generator):
    tf_idf = RetrievalModel.TFIDF(N, inverted_index, document_tokens)
    ranked_list = tf_idf.tf_idf_list(query_dict)

    with open(tfidf_table, "w") as file:
        csv_writer = csv.writer(file)
        for query_id, scores in ranked_list.items():
            i = 0
            for score in scores:
                i += 1
                csv_writer.writerow(
                    (query_id, "Q0", score[0], i, score[1], "tf_idf"))
                if i == 1:
                    query = query_dict[query_id]
                    print("Given Query: " + query)
                    print("Top Document for given query: " + score[0])
                    print("Snippet: \n" +
                          snippet_generator.generate_snippet(score[0], query))
    file.close()

示例#3

显示文件

def retrieve_bm_25_docs(snippet_generator):
    bm_25 = RetrievalModel.BM25(N, inverted_index, document_tokens,
                                relevance_dict)
    ranked_list = bm_25.bm_25_list(query_dict)

    with open(bm25_table, "w") as file:
        csv_writer = csv.writer(file)
        for query_id, scores in ranked_list.items():
            i = 0
            for score in scores:
                i += 1
                csv_writer.writerow(
                    (query_id, "Q0", score[0], i, score[1], "bm_25"))
                if i == 1:
                    query = query_dict[query_id]
                    print("Given Query: " + query)
                    print("Top Document for given query: " + score[0])
                    print("Snippet: \n" +
                          snippet_generator.generate_snippet(score[0], query))
    file.close()

示例#4

显示文件

文件： Task_3A.py 项目： anurago93/cs6200f16-IRProject

def retrieve_docs():
    snippet_generator = Snippet.SnippetGenerator(document_tokens,"")
    stop_words = retrieve_stop_words()
    updated_document_tokens = update_docs(stop_words)
    updated_query_dict = update_queries(stop_words)
    model = RetrievalModel.CosineSimilarity(N, inverted_index, updated_document_tokens)
    ranked_list = model.cosine_similarity_list(updated_query_dict)

    with open(stop_table, "w") as file:
        csv_writer = csv.writer(file)
        for query_id, scores in ranked_list.items():
            i = 0
            for score in scores:
                i += 1
                csv_writer.writerow((query_id, "Q0", score[0], i, score[1], "using_stop_words"))
                if i == 1:
                    query = query_dict[query_id]
                    print("Given Query: " + query)
                    print("Top Document for given query: " + score[0])
                    print("Snippet: \n" + snippet_generator.generate_snippet(score[0],query))
    file.close()

示例#5

显示文件

def retrieve_cosine_sim_docs(snippet_generator):
    cosine_sim = RetrievalModel.CosineSimilarity(N, inverted_index,
                                                 document_tokens)
    ranked_list = cosine_sim.cosine_similarity_list(query_dict)

    with open(vsm_table, "w") as file:
        csv_writer = csv.writer(file)
        for query_id, scores in ranked_list.items():
            i = 0
            for score in scores:
                i += 1
                csv_writer.writerow((query_id, "Q0", score[0], i, score[1],
                                     "vector_space_model"))
                if i == 1:
                    query = query_dict[query_id]
                    print("Given Query: " + query)
                    print("Top Document for given query: " + score[0])
                    print("Snippet: \n" +
                          snippet_generator.generate_snippet(score[0], query))

    file.close()