Python Sentence.clear_embeddings 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: flair.data

클래스/타입: Sentence

메소드/함수: clear_embeddings

hotexamples.com에서의 예제들: 9

Python Sentence.clear_embeddings - 9개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 flair.data.Sentence.clear_embeddings에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Sentence(30)

get_embedding(30)

to_dict(30)

get_spans(30)

add_token(30)

add_label(12)

get_labels(11)

to_original_text(9)

clear_embeddings(9)

get_label_names(6)

get_token(6)

append(3)

remove_labels(3)

id(2)

infer_space_after(2)

ner(2)

sequence(2)

text_id(2)

add_complex_label(2)

get_relations(1)

add_labels(1)

_convert_span_labels(1)

indices(1)

person(1)

strip(1)

length(1)

예제 #1

파일 보기

파일: featurizer.py 프로젝트: dvdbsnr/nlp-gym

 def init_on_reset(self, input_text: Union[List[str], str]):
     sent = Sentence(input_text)
     self.doc_embeddings.embed(sent)
     self._current_token_embeddings = [
         token.embedding.cpu().detach() for token in sent
     ]
     sent.clear_embeddings()

예제 #2

파일 보기

 def _get_sentence_embedding(self, text: str) -> torch.Tensor:
     text = "..." if len(text) == 0 else text
     sent = Sentence(text)
     self.doc_embeddings.embed(sent)
     if len(sent) >= 1:
         embedding = torch.tensor(sent.embedding.cpu().detach().numpy()).reshape(1, -1)
     else:
         embedding = torch.tensor(sent[0].embedding.cpu().detach().numpy()).reshape(1, -1)
     sent.clear_embeddings()
     return embedding

예제 #3

파일 보기

파일: test_text_classifier.py 프로젝트: tadejmagajna/flair

def test_load_use_classifier():
    loaded_model: TextClassifier = TextClassifier.load("sentiment")

    sentence = Sentence("I love Berlin")
    sentence_empty = Sentence("       ")

    loaded_model.predict(sentence)
    loaded_model.predict([sentence, sentence_empty])
    loaded_model.predict([sentence_empty])
    del loaded_model

    sentence.clear_embeddings()
    sentence_empty.clear_embeddings()

예제 #4

파일 보기

def test_load_use_serialized_tagger():
    loaded_model = SequenceTagger.load(u'ner')
    sentence = Sentence(u'I love Berlin')
    sentence_empty = Sentence(u'       ')
    loaded_model.predict(sentence)
    loaded_model.predict([sentence, sentence_empty])
    loaded_model.predict([sentence_empty])
    sentence.clear_embeddings()
    sentence_empty.clear_embeddings()
    loaded_model = SequenceTagger.load(u'pos')
    loaded_model.predict(sentence)
    loaded_model.predict([sentence, sentence_empty])
    loaded_model.predict([sentence_empty])

예제 #5

파일 보기

파일: test_model_integration.py 프로젝트: nguyenvo09/flair

def test_load_use_serialized_tagger():
    loaded_model: SequenceTagger = SequenceTagger.load("ner")

    sentence = Sentence("I love Berlin")
    sentence_empty = Sentence("       ")

    loaded_model.predict(sentence)
    loaded_model.predict([sentence, sentence_empty])
    loaded_model.predict([sentence_empty])

    sentence.clear_embeddings()
    sentence_empty.clear_embeddings()

    loaded_model: SequenceTagger = SequenceTagger.load("pos")

    loaded_model.predict(sentence)
    loaded_model.predict([sentence, sentence_empty])
    loaded_model.predict([sentence_empty])

예제 #6

파일 보기

def create_emb(doc):
    batch_size = 60

    dataset_section = []
    for section_title, section_text in doc['raw']['sections'].items():
        text = section_text.strip()
        # tokenize each sentence
        # skip language detection, embedding wont match anyway
        nlp_doc = nlp(text)

        texts = []
        flair_sentences = []
        for sentence in nlp_doc.sents:
            flair_sent = Sentence(sentence.text)
            flair_sentences.append(flair_sent)
            texts.append(sentence.text)

        for i in range(0, len(flair_sentences), batch_size):
            flair_emb.embed(flair_sentences[i:i + batch_size])

        for flair_sent, text in zip(flair_sentences, texts):
            for token in flair_sent.tokens:
                mean_vector = token.embedding
                max_value = -2
                max_part = None
                for possible_part, candidates in poss_sections.items():
                    for candidate in candidates:
                        score = cos(mean_vector, candidate)
                        if score > 0.9:  # consideramos valido
                            if max_value < score:
                                max_value = score
                                max_part = possible_part

            flair_sent.clear_embeddings()

            if max_part is not None:
                dataset_section.append({
                    'hash_id': doc['hash_id'],
                    'title': section_title,
                    'text': text,
                    'match': max_part
                })

    return dataset_section

예제 #7

파일 보기

파일: test_embeddings.py 프로젝트: azawalich/flair

def test_fine_tunable_flair_embedding():
    language_model_forward = LanguageModel(Dictionary.load(
        'chars'), is_forward_lm=True, hidden_size=32, nlayers=1)
    embeddings = DocumentRNNEmbeddings([FlairEmbeddings(
        language_model_forward, fine_tune=True)], hidden_size=128, bidirectional=False)
    sentence = Sentence('I love Berlin.')
    embeddings.embed(sentence)
    assert (len(sentence.get_embedding()) == 128)
    assert (len(sentence.get_embedding()) == embeddings.embedding_length)
    sentence.clear_embeddings()
    assert (len(sentence.get_embedding()) == 0)
    embeddings = DocumentLMEmbeddings(
        [FlairEmbeddings(language_model_forward, fine_tune=True)])
    sentence = Sentence('I love Berlin.')
    embeddings.embed(sentence)
    assert (len(sentence.get_embedding()) == 32)
    assert (len(sentence.get_embedding()) == embeddings.embedding_length)
    sentence.clear_embeddings()
    assert (len(sentence.get_embedding()) == 0)

예제 #8

파일 보기

cos = torch.nn.CosineSimilarity(dim=0, eps=1e-6)

poss_sections = {
    '#gender': ['gender', 'sex', 'gentleman'],
    '#male': ['male', 'man', 'men'],
    '#female': ['female', 'woman', 'women'],
}

# substitute term by its embedding
for list_candidates in tqdm(poss_sections.values(),
                            desc='Embedding search terms'):
    for i in range(len(list_candidates)):
        sentence = Sentence(list_candidates[i].lower())
        flair_emb.embed(sentence)
        list_candidates[i] = sentence.embedding
        sentence.clear_embeddings()

dataset = []
print('Retrieving documents from database...')
documents = Database.list_raw_documents()


def create_emb(doc):
    batch_size = 60

    dataset_section = []
    for section_title, section_text in doc['raw']['sections'].items():
        text = section_text.strip()
        # tokenize each sentence
        # skip language detection, embedding wont match anyway
        nlp_doc = nlp(text)

예제 #9

파일 보기

파일: featurizer.py 프로젝트: dvdbsnr/nlp-gym

 def _get_input_dim(self):
     sent = Sentence("A random text to get the embedding dimension")
     self.doc_embeddings.embed(sent)
     dim = sent[0].embedding.shape[0]
     sent.clear_embeddings()
     return dim