Python Doc2Vec.infer_vector 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: gensim.models.doc2vec

클래스/타입: Doc2Vec

메소드/함수: infer_vector

hotexamples.com에서의 예제들: 5

Python Doc2Vec.infer_vector - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 gensim.models.doc2vec.Doc2Vec.infer_vector에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Doc2Vec(30)

load(30)

infer_vector(5)

save(3)

load_word2vec_format(2)

delete_temporary_training_data(1)

fit_transform(1)

loadModel(1)

예제 #1

파일 보기

 def convert_doc_to_vector(self, model: doc2vec.Doc2Vec,
                           token_series: pd.Series, outpath):
     # Convert document tokens to numerical vector
     doc_mat = np.vstack([model.infer_vector(doc) for doc in token_series])
     # Build dataframe with above document vector
     df = pd.DataFrame(data=doc_mat, index=token_series.index)
     df.to_pickle(outpath)

예제 #2

파일 보기

def _infer_document_embeddings(model: Doc2Vec,
                               doc_list: List[List[str]]) -> np.ndarray:
    """
    NOTE: Inference is not deterministic therefore representations will vary between calls
    Returns a 2D array with shape (num_docs, embedding_dimension)
    """
    print('Infering document embeddings..')
    return np.array([model.infer_vector(doc) for doc in doc_list])

예제 #3

파일 보기

def getAllSentenceEmbeddings(model: Doc2Vec, taggedDocuments: Sequence[TaggedDocument], wordsToEmbed: Path) -> Iterable[SentenceEmbeddings]:
    sentenceEmbeddings = []
    for word in readTargetWords(wordsToEmbed):
        word = word.lower()
        arr = []

        # creating the sentence embeddings for each target word
        for corpusDocument in getDocumentsContaining(word, taggedDocuments):
            embedding = model.infer_vector(corpusDocument.sentence)
            arr.append((corpusDocument.corpusId, embedding))

        embeddingsPerCorpus = {}
        for corpusId, embedding in arr:
            embeddingsPerCorpus.setdefault(corpusId, []).append(embedding)
        sentenceEmbeddings.append(SentenceEmbeddings(word, embeddingsPerCorpus))
    yield from sentenceEmbeddings

예제 #4

파일 보기

파일: core.py 프로젝트: jiaxy/EHAdvisor

def method_row_vec(method_feat: MethodFeature, source_feat: MethodFeature,
                   pos_feat: PositionFeature, proj_feat: ProjectFeature,
                   model: Doc2Vec):
    return np.concatenate([
        model.infer_vector(method_feat.docs),
        [
            source_feat.exception_id, method_feat.package_depth,
            method_feat.param_num
        ],
        [
            pos_feat.method_top, pos_feat.method_bottom, pos_feat.class_top,
            pos_feat.class_bottom, pos_feat.package_top,
            pos_feat.package_bottom
        ],
        proj_feat.dependencies_vec,
        proj_feat.abstract_vec,
        np.zeros(shape=(1, ))  # FIXME 不知道为什么要加个 0 在这里
    ])

예제 #5

파일 보기

파일: core.py 프로젝트: jiaxy/EHAdvisor

def make_abstract_vec(project_folder: str, readme_path: Optional[str],
                      model: Doc2Vec) -> np.ndarray:
    tokens = abstract_to_tokens(project_folder, readme_path)
    return model.infer_vector(tokens)