Python Retrieval 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: vec4ir

클래스/타입: Retrieval

hotexamples.com에서의 예제들: 11

Python Retrieval - 11개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 vec4ir.Retrieval에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Retrieval(6)

query(6)

fit(4)

자주 사용되는 메소드들

Retrieval (6)

query (6)

fit (4)

예제 #1

파일 보기

파일: test_vec4ir.py 프로젝트: selvamshan/vec4ir

def test_word2vec():
    model = Word2Vec([doc.split() for doc in documents], iter=1, min_count=1)
    match_op = Matching()
    wcd = WordCentroidDistance(model.wv)
    retrieval = Retrieval(wcd, matching=match_op)
    retrieval.fit(documents)
    result = retrieval.query('dog')
    assert result[0] == 0

예제 #2

파일 보기

파일: test_vec4ir.py 프로젝트: wayne9qiu/vec4ir

def test_retrieval():
    # Test retrieval with given ids
    tfidf = Tfidf()
    retrieval = Retrieval(tfidf)
    ids = ['fox_example', 'lazy_example']
    retrieval.fit(documents, ids)
    result = retrieval.query('fox')
    assert result[0] == 'fox_example'
    assert result[1] == 'lazy_example'

예제 #3

파일 보기

파일: test_vec4ir.py 프로젝트: shatha2014/vec4ir

def test_doc2vec_inference():
    tagged_docs = [TaggedDocument(simple_preprocess(doc), [i])
                   for i, doc in enumerate(documents)]
    model = Doc2Vec(tagged_docs, epochs=1, min_count=1)
    d2v = Doc2VecInference(model, DEFAULT_ANALYZER)
    match_op = Matching()
    retrieval = Retrieval(d2v, matching=match_op).fit(documents)
    result = retrieval.query("scientists")
    assert result[0] == 1

예제 #4

파일 보기

파일: test_vec4ir.py 프로젝트: shatha2014/vec4ir

def test_retrieval():
    # Test retrieval with given ids
    tfidf = Tfidf()
    retrieval = Retrieval(tfidf)
    ids = ['fox_example', 'lazy_example']
    retrieval.fit(documents, ids)
    result = retrieval.query('fox')
    assert result[0] == 'fox_example'
    assert result[1] == 'lazy_example'

예제 #5

파일 보기

파일: test_vec4ir.py 프로젝트: wayne9qiu/vec4ir

def test_doc2vec_inference():
    tagged_docs = [
        TaggedDocument(simple_preprocess(doc), [i])
        for i, doc in enumerate(documents)
    ]
    model = Doc2Vec(tagged_docs, epochs=1, min_count=1)
    d2v = Doc2VecInference(model, DEFAULT_ANALYZER)
    match_op = Matching()
    retrieval = Retrieval(d2v, matching=match_op).fit(documents)
    result = retrieval.query("scientists")
    assert result[0] == 1

예제 #6

파일 보기

파일: test_vec4ir.py 프로젝트: shatha2014/vec4ir

def test_word2vec():
    model = Word2Vec([doc.split() for doc in documents], iter=1, min_count=1)
    match_op = Matching()
    with pytest.raises(ValueError):
        wcd = WordCentroidDistance(model)

    wcd = WordCentroidDistance(model.wv)
    retrieval = Retrieval(wcd, matching=match_op)
    retrieval.fit(documents)
    result = retrieval.query('dog')
    assert result[0] == 0

예제 #7

파일 보기

파일: test_reddit_wcd_idf.py 프로젝트: JiachenRen/wcd-idf-app-prediction

def test_reddit_wcd_idf():
    model = KeyedVectors.load_word2vec_format(
        "model/reddit.en.text.vector")  # Replace with directory to your .vector model file
    wcd = WordCentroidDistance(model.wv)
    retrieval = Retrieval(wcd)
    retrieval.fit(documents)

    while True:
        query = input("Please enter the query:\n")
        if query == "exit":
            break
        else:
            result = retrieval.query(query, return_scores=True)
            print(result)

예제 #8

파일 보기

파일: test_query_expansion.py 프로젝트: shatha2014/vec4ir

def test_expansion_inside_retrieval():
    # Integration test within full retrieval pipeline
    model = Word2Vec([doc.split() for doc in DOCUMENTS], iter=1, min_count=1)
    n_expansions = 2

    tfidf = Tfidf()
    match_op = Matching()
    expansion_op = EmbeddedQueryExpansion(model.wv, m=n_expansions)

    retrieval = Retrieval(tfidf,  # The retrieval model
                          matching=match_op,
                          query_expansion=expansion_op)
    ids = ['fox_ex', 'surf_ex']
    retrieval.fit(DOCUMENTS, ids)
    result = retrieval.query('surfing surfers do surf green')
    assert result[0] == 'surf_ex'

예제 #9

파일 보기

파일: test_vec4ir.py 프로젝트: wayne9qiu/vec4ir

def test_combined():
    model = Word2Vec([doc.split() for doc in documents], iter=1, min_count=1)
    wcd = WordCentroidDistance(model.wv)
    tfidf = Tfidf()

    wcd.fit(documents)
    # # they can operate on different feilds
    tfidf.fit(['fox', 'scientists'])
    match_op = Matching().fit(documents)

    combined = wcd + tfidf**2

    retrieval = Retrieval(combined, matching=match_op, labels=[7, 42])
    result = retrieval.query('fox')
    assert result[0] == 7
    result = retrieval.query('scientists')
    assert result[0] == 42

예제 #10

파일 보기

def test_expansion_inside_retrieval():
    # Integration test within full retrieval pipeline
    model = Word2Vec([doc.split() for doc in DOCUMENTS], iter=1, min_count=1)
    n_expansions = 2

    tfidf = Tfidf()
    match_op = Matching()
    expansion_op = EmbeddedQueryExpansion(model.wv, m=n_expansions)

    retrieval = Retrieval(
        tfidf,  # The retrieval model
        matching=match_op,
        query_expansion=expansion_op)
    ids = ['fox_ex', 'surf_ex']
    retrieval.fit(DOCUMENTS, ids)
    result = retrieval.query('surfing surfers do surf green')
    assert result[0] == 'surf_ex'

예제 #11

파일 보기

파일: test_vec4ir.py 프로젝트: shatha2014/vec4ir

def test_combined():
    model = Word2Vec([doc.split() for doc in documents], iter=1, min_count=1)
    wcd = WordCentroidDistance(model.wv)
    tfidf = Tfidf()

    wcd.fit(documents)
    # # they can operate on different feilds
    tfidf.fit(['fox', 'scientists'])
    match_op = Matching().fit(documents)

    combined = wcd + tfidf ** 2

    retrieval = Retrieval(combined, matching=match_op, labels=[7,42])
    result = retrieval.query('fox')
    assert result[0] == 7 
    result = retrieval.query('scientists')
    assert result[0] == 42