Exemplos de FastText.similarity em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: gensim.models

Classe / Tipo: FastText

Método / Função: similarity

Exemplos em hotexamples.com: 3

FastText.similarity em Python - 3 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de gensim.models.FastText.similarity em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

FastText(30)

save(30)

train(30)

load_fasttext_format(30)

build_vocab(30)

load(26)

most_similar(13)

init_sims(10)

similarity(3)

add(2)

fit(2)

similar_by_word(2)

save_word2vec_format(2)

summary(1)

similar_by_vector(1)

save_model(1)

callbacks(1)

prepare_weights(1)

compile(1)

min_alpha(1)

__init__(1)

iter(1)

fit_transform(1)

evaluate(1)

transform(1)

Métodos Frequentes

FastText (30)

save (30)

train (30)

load_fasttext_format (30)

build_vocab (30)

load (26)

most_similar (13)

init_sims (10)

similarity (3)

add (2)

Métodos Frequentes

fit (2)

similar_by_word (2)

save_word2vec_format (2)

summary (1)

similar_by_vector (1)

save_model (1)

callbacks (1)

prepare_weights (1)

compile (1)

min_alpha (1)

__init__ (1)

iter (1)

fit_transform (1)

evaluate (1)

transform (1)

Métodos Frequentes

__init__ (1)

iter (1)

fit_transform (1)

evaluate (1)

transform (1)

Exemplo n.º 1

0

Exibir arquivo

class SearchEngine: def __init__(self, connection_provider, ft_embed_size): print('Search engine initialization') self.conn_provider = connection_provider self.fasttext = FastText(size=ft_embed_size, window=3, min_count=1, iter=100, workers=-1, min_n=1, max_n=5) name_corpus = [] for i, app in enumerate( self.conn_provider.get_all_articles().iterator()): name_corpus.append([app.appendix]) if i >= 3000: break self.fasttext.build_vocab(name_corpus) corp_count = self.fasttext.corpus_count n_iter = 1000 self.fasttext.train(name_corpus, total_examples=corp_count, epochs=n_iter) del name_corpus print('Done') def find_match(self, new_id, top_n=5): new = self.conn_provider.get_article(new_id) new_entities = new.named_entities scores = [] for candidate in self.conn_provider.get_all_articles().iterator(): if candidate.global_id == new.global_id: continue score = 0 cand_entities = set(candidate.named_entities) for ent in new_entities: if ent in cand_entities: score += 1 score += self.fasttext.similarity(new.appendix, candidate.appendix) score = score / (len(new_entities) + 1) scores.append((candidate.global_id, score)) scores = sorted(scores, key=lambda x: -x[1]) return scores[:top_n]

Exemplo n.º 2

0

Exibir arquivo

Arquivo: nlp4_rw_word2vec.py Projeto: dimang777/Insight

size=25, window=5, min_count=2, workers=4, sg=1) if 0: from gensim.models import FastText model_rw = FastText(sentences=desc_token, size=25, window=5, min_count=2, workers=4, sg=1) model_rw.similarity('12 Linajes Reserva 2012', '13th Street Burger Blend Gamay Pinot Noir VQA') model_rw.save("word2vec_model_test.model") # model_rw_load = Word2Vec.load("word2vec_model_test.model") model_rw.wv.most_similar('dri fruit') model_rw.wv.vectors.shape len(model_rw.wv.vocab) model_rw.wv.vocab model_rw.vocabulary model_rw.wv.similarity('dri', 'fruit')

Exemplo n.º 3

0

Exibir arquivo

Arquivo: SDP_ CODE.py Projeto: Igbal032/SDP_PYTHON_CODES

) #Saving The Model modelSGw2v.wv.save_word2vec_format("SGw2v.txt", binary=False) #Delete model in order not to load RAM a lot modelSGw2v = None #Creating CBOW FastText model modelCBOWFT = FastText( sentences=gensim.models.word2vec.LineSentence("path_to_data_corpus"), min_n=4, max_n=2) #Checking cosine similarity between two words modelCBOWFT.similarity('first_word', 'second_word') #Showing top 5 similar words to a given words with their cosie similarities modelCBOWFT.wv.most_similar("word", topn=5) #Checking Word Analogy modelCBOWFT.wv.most_similar( positive=["first_positive_word", "second_positive_word"], negative=["negative_word"], topn=1) #Checking syntactic and semantic, capital-country scores of the model, Intrinsic Evaluation print( f" syntactic score: - {modelCBOWFT.wv.evaluate_word_analogies('path_to_syntactic_inputs')[0]}" ) print(