Python read_lines 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: file_util.file_processor

메소드/함수: read_lines

hotexamples.com에서의 예제들: 4

Python read_lines - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 file_util.file_processor.read_lines에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def run_validation(validation_file_path, w2vec_model_file_path, nn_model, result_path, threshold,
                   vector_dimension):
    # loading the pre-trained model
    w2vec_model = gensim.models.KeyedVectors.load_word2vec_format(w2vec_model_file_path)

    lines = file_processor.read_lines(validation_file_path)
    lines.pop(0)  # removing column header
    qid_queries = get_queries(lines)
    counter = 0;
    total_queries = len(qid_queries)
    for qid in qid_queries:
        counter += 1
        print("Started->", counter)
        query = qid_queries[qid]
        pid_passage_relevance_tuple = file_processor.get_candidate_passages_relevance_by_qid(lines, qid)
        scored_passage = []
        for ppr in pid_passage_relevance_tuple:
            passage = ppr["passage"]
            relevancy = float(ppr["relevancy"])
            feature_vector = word2vec.build_feature_vector(query, passage, w2vec_model, vector_dimension)
            score = get_probability_score(nn_model, feature_vector)
            pre_relevancy = 1.0 if score >= threshold else 0.0
            scored_passage.append(
                {"qid": qid, "pid": ppr["pid"], "rank": 0, "score": score, "relevancy": relevancy,
                 "pre_relevancy": pre_relevancy, "assigment_name": "A1", "algorithm_name": "NN"})
        sorted_passage = set_rank_by_score(scored_passage)
        file_processor.write_scored_passage(sorted_passage, result_path)
        # select top 250 queries
        if counter > 250:
            break

예제 #2

파일 보기

파일: metric_calculator.py 프로젝트: MRHMisu/IRDM-ML-Models

def get_scored_passage_from_result(result_file_path):
    result_lines = file_processor.read_lines(result_file_path)
    scored_passage = []
    for line in result_lines:
        elements = line.split("\t")
        qid = elements[0]
        pid = elements[2]
        rank = int(elements[3])
        score = float(elements[4])
        relevancy = float(elements[6])
        scored_passage.append({
            "qid": qid,
            "pid": pid,
            "rank": rank,
            "score": score,
            "relevancy": relevancy
        })
    return scored_passage

예제 #3

파일 보기

파일: bm25_executor.py 프로젝트: MRHMisu/IRDM-ML-Models

def run_bm25_model(validation_file_path, result_file_path):
    lines = file_processor.read_lines(validation_file_path)
    lines.pop(0)  # removing column header
    qid_queries = get_queries(lines)
    counter = 0
    total_queries = len(qid_queries)
    for qid in qid_queries:
        counter += 1
        query = qid_queries[qid]
        pid_passage_relevance_tuple = file_processor.get_candidate_passages_relevance_by_qid(
            lines, qid)
        all_pid_passage = get_pid_passage_pair(pid_passage_relevance_tuple)
        relevant_pid_passage = get_relevant_pid_passage_pair(
            pid_passage_relevance_tuple)
        scored_passage = get_scored_passage_by_query(qid, query,
                                                     all_pid_passage,
                                                     relevant_pid_passage)
        print("Completed->  " + str(counter) + "  -> out of: " +
              str(total_queries))
        file_processor.write_ranked_passage(scored_passage, result_file_path)

예제 #4

파일 보기

import file_util.file_processor as file_processor
import index.index_builder as index_builder

file_path = "../dataset/candidate_passages_top1000.tsv"

# passage collection
lines = file_processor.read_lines(file_path)

pid_passage_pair = file_processor.get_candidate_passages_by_qid(
    lines, "1113437")
index = index_builder.build_inverted_index(pid_passage_pair)