Exemplos de SentenceTransformer.extract_vectors em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: sentence_transformers

Método / Função: extract_vectors

Exemplos em hotexamples.com: 2

SentenceTransformer.extract_vectors em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de sentence_transformers.SentenceTransformer.extract_vectors em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

SentenceTransformer(30)

encode(30)

get_sentence_embedding_dimension(25)

evaluate(25)

fit(17)

eval(16)

cuda(11)

compile(4)

encode_multi_process(4)

_first_module(4)

load_state_dict(3)

inference_from_dicts(3)

get_max_seq_length(3)

add_module(2)

extract_vectors(2)

embed_sentences(2)

encoder(1)

extract_keywords(1)

build_vocab(1)

fc1(1)

encode_torch(1)

get_beta(1)

add(1)

_last_module(1)

get_sentence_features(1)

get_theta(1)

half(1)

lm_head(1)

load_model(1)

Métodos Frequentes

SentenceTransformer (30)

encode (30)

get_sentence_embedding_dimension (25)

evaluate (25)

fit (17)

eval (16)

cuda (11)

compile (4)

encode_multi_process (4)

_first_module (4)

Métodos Frequentes

load_state_dict (3)

inference_from_dicts (3)

get_max_seq_length (3)

add_module (2)

extract_vectors (2)

embed_sentences (2)

encoder (1)

extract_keywords (1)

build_vocab (1)

fc1 (1)

encode_torch (1)

get_beta (1)

add (1)

_last_module (1)

get_sentence_features (1)

get_theta (1)

half (1)

lm_head (1)

load_model (1)

Métodos Frequentes

encode_torch (1)

get_beta (1)

add (1)

_last_module (1)

get_sentence_features (1)

get_theta (1)

half (1)

lm_head (1)

load_model (1)

Exemplo n.º 1

0

Exibir arquivo

class ElasticsearchRetriever(BaseRetriever): def __init__(self, document_store, embedding_model=None, gpu=True, model_format="farm", pooling_strategy="reduce_mean", emb_extraction_layer=-1, direct_filters=None, custom_query=None): """ TODO :param document_store: :param embedding_model: :param gpu: :param model_format: """ self.document_store = document_store self.model_format = model_format self.embedding_model = None self.pooling_strategy = pooling_strategy self.emb_extraction_layer = emb_extraction_layer self.direct_filters = direct_filters self.custom_query = custom_query # only needed if you want to retrieve via cosinge similarity of embeddings if embedding_model: logger.info( f"Init retriever using embeddings of model {embedding_model}") if model_format == "farm" or model_format == "transformers": self.embedding_model = Inferencer.load(embedding_model, task_type="embeddings", gpu=gpu, batch_size=4, max_seq_len=512) elif model_format == "sentence_transformers": from sentence_transformers import SentenceTransformer # pretrained embedding models coming from: https://github.com/UKPLab/sentence-transformers#pretrained-models # e.g. 'roberta-base-nli-stsb-mean-tokens' self.embedding_model = SentenceTransformer(embedding_model) else: raise NotImplementedError def retrieve(self, query: str, candidate_doc_ids: [str] = None, top_k: int = 10) -> [Document]: if self.embedding_model: # cos. similarity of embeddings query_emb = self.create_embedding(query) documents = self.document_store.query_by_embedding( query_emb, top_k, candidate_doc_ids) else: # regular ES query (e.g. BM25) documents = self.document_store.query(query, top_k, candidate_doc_ids) logger.info(f"Got {len(documents)} candidates from retriever") return documents def create_embedding(self, text): if self.model_format == "farm": res = self.embedding_model.extract_vectors( dicts=[{ "text": text }], extraction_strategy=self.pooling_strategy, extraction_layer=self.emb_extraction_layer) emb = list(res[0]["vec"]) elif self.model_format == "sentence_transformers": # text is single string, sentence-transformers needs a list of strings res = self.embedding_model.encode( [text]) # get back list of numpy embedding vectors emb = res[0].tolist() return emb

Exemplo n.º 2

0

Exibir arquivo

class EmbeddingRetriever(BaseRetriever): def __init__( self, document_store: Type[BaseDocumentStore], embedding_model: str, gpu: bool = True, model_format: str = "farm", pooling_strategy: str = "reduce_mean", emb_extraction_layer: int = -1, ): """ TODO :param document_store: :param embedding_model: :param gpu: :param model_format: """ self.document_store = document_store self.model_format = model_format self.embedding_model = embedding_model self.pooling_strategy = pooling_strategy self.emb_extraction_layer = emb_extraction_layer logger.info( f"Init retriever using embeddings of model {embedding_model}") if model_format == "farm" or model_format == "transformers": self.embedding_model = Inferencer.load(embedding_model, task_type="embeddings", gpu=gpu, batch_size=4, max_seq_len=512) elif model_format == "sentence_transformers": from sentence_transformers import SentenceTransformer # pretrained embedding models coming from: https://github.com/UKPLab/sentence-transformers#pretrained-models # e.g. 'roberta-base-nli-stsb-mean-tokens' self.embedding_model = SentenceTransformer(embedding_model) else: raise NotImplementedError def retrieve(self, query: str, candidate_doc_ids: [str] = None, top_k: int = 10) -> [Document]: query_emb = self.create_embedding(query) documents = self.document_store.query_by_embedding( query_emb, top_k, candidate_doc_ids) return documents def create_embedding(self, text): if self.model_format == "farm": res = self.embedding_model.extract_vectors( dicts=[{ "text": text }], extraction_strategy=self.pooling_strategy, extraction_layer=self.emb_extraction_layer, ) emb = list(res[0]["vec"]) elif self.model_format == "sentence_transformers": # text is single string, sentence-transformers needs a list of strings res = self.embedding_model.encode( [text]) # get back list of numpy embedding vectors emb = res[0].tolist() return emb