Python clean_query 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: galagos.parse

메소드/함수: clean_query

hotexamples.com에서의 예제들: 6

Python clean_query - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 galagos.parse.clean_query에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

    def tokenize(self, text):
        tokens = nltk.tokenize.word_tokenize(text.lower())
        if self.drop_stopwords:
            tokens = drop_words(tokens, self.stopword)

        terms = clean_query(tokens)
        out_terms = []
        for t in terms:
            t = t.replace("'", "")
            if t:
                out_terms.append(t)
        return out_terms

예제 #2

파일 보기

def write_claim_as_query():
    d_ids = list(load_train_claim_ids())
    claims = get_claims_from_ids(d_ids)
    queries = []
    for c in claims:
        cid = c["cId"]
        claim_text = c["text"]
        tokens = claim_text.split()
        query_text = clean_query(tokens)
        print(query_text)
        q_entry = get_query_entry_bm25_anseri(cid, query_text)
        queries.append(q_entry)

    out_path = os.path.join(output_path, "perspective_dev_claim_query.json")
    save_queries_to_file(queries, out_path)

예제 #3

파일 보기

파일: galago_query_maker.py 프로젝트: clover3/Chair

def main():
    print("Start")
    spr = StreamPickleReader("robust_candi_query_")
    query_per_task = 1000 * 10
    out_idx = 0
    while spr.has_next():
        queries = []
        for i in range(query_per_task):
            if not spr.has_next():
                break
            q_id, query = spr.get_item()
            query = clean_query(query)
            queries.append(get_query_entry(q_id, query))

        out_path = os.path.join(cpath.output_path, "query",
                                "g_query_{}.json".format(out_idx))
        save_queries_to_file(queries, out_path)
        out_idx += 1

예제 #4

파일 보기

파일: xml_query_to_json.py 프로젝트: clover3/Chair

 def transform(q: Query) -> Dict:
     tokens = word_tokenize(q.text)
     tokens = clean_query(tokens)
     return format_query_bm25(q.qid, tokens)

예제 #5

파일 보기

def clean_tokenize_str_to_tokens(raw_str: str) -> List[str]:
    terms = clean_query(nltk.word_tokenize(raw_str))
    terms = [t.lower() for t in terms]
    return terms

예제 #6

파일 보기

def clean_text_for_query(raw_str: str) -> str:
    terms = clean_query(nltk.word_tokenize(raw_str))
    terms = " ".join([t.lower() for t in terms])
    return terms