Python VSM.get_ranking示例

编程语言: Python

命名空间/包名称: vsm

类/类型: VSM

方法/功能: get_ranking

hotexamples.com的示例: 2

Python VSM.get_ranking - 已找到2个示例。这些是从开源项目中提取的最受好评的vsm.VSM.get_ranking现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

VSM(30)

init(2)

get_ranking(2)

b(1)

add(1)

tf_type(1)

sim_of_all_sentence(1)

save(1)

read_inverted(1)

process_docs(1)

k3(1)

k1(1)

idf_type(1)

bm25_vector_space(1)

_compute_idf(1)

get_connection(1)

findall(1)

doc_to_index(1)

doc_len_norm(1)

do_searching(1)

commit(1)

vocab_to_index(1)

示例#1

显示文件

def run(args):
    if args.build:
        model = build(args)

    if args.best:
        args.rocchio = True

    try:
        print('loading model from %s' % args.load_model)
        model = VSM(model_path=args.load_model)
    except:
        print('failed to load model, build from raw.')
        model = build(args)

    query_list, query_id = process_query(args.query_file)
    output_file = open(args.ranked_list, 'w+')
    print('query_id,retrieved_docs', file=output_file)
    for i, query in enumerate(query_list):
        doc_id, doc_score = model.get_ranking(query, args.rocchio)
        print('%s,%s' % (query_id[i], ' '.join(doc_id[:100])),
              file=output_file)

示例#2

显示文件

文件： grid_search.py 项目： andy920262/IR2019

def run():
    import pandas as pd
    model = VSM(model_path='./model.pl')
    query_list, query_id = process_query('../queries/query-train.xml')
    answer = pd.read_csv('../queries/ans_train.csv')[['retrieved_docs']].values
    answer = [a[0].strip().split(' ') for a in answer]

    for p in product_dict(params): 
        model.k1 = p['k1']
        model.b = p['b']
        model.k3 = p['k3']
        model.tf_type = p['tf']
        model.idf_type = p['idf']
        model.doc_len_norm = p['norm']
        model._compute_idf()
        
        score = []
        for i, query in enumerate(query_list):
            doc_id, doc_score = model.get_ranking(query, p['rocchio'], p['n'], p['k'])
            score.append(MAP(doc_id[:100], answer[i]))
        score = sum(score) / len(score)
        model_str = 'k1=%.2f,b=%.2f,k3=%d,idf_type=%s,rocchio=%s,n=%d,k=%d,score=%.5f' % (p['k1'], p['b'], p['k3'], p['idf'], p['rocchio'], p['n'], p['k'], score)
        print(model_str)