Python Sentence.get_token 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: flair.data

클래스/타입: Sentence

메소드/함수: get_token

hotexamples.com에서의 예제들: 6

Python Sentence.get_token - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 flair.data.Sentence.get_token에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Sentence(30)

get_embedding(30)

to_dict(30)

get_spans(30)

add_token(30)

add_label(12)

get_labels(11)

to_original_text(9)

clear_embeddings(9)

get_label_names(6)

get_token(6)

append(3)

remove_labels(3)

id(2)

infer_space_after(2)

ner(2)

sequence(2)

text_id(2)

add_complex_label(2)

get_relations(1)

add_labels(1)

_convert_span_labels(1)

indices(1)

person(1)

strip(1)

length(1)

예제 #1

파일 보기

파일: test_data.py 프로젝트: azawalich/flair

def test_sentence_whitespace_tokenization():
    sentence = Sentence('I  love Berlin .')
    assert (4 == len(sentence.tokens))
    assert ('I' == sentence.get_token(1).text)
    assert ('love' == sentence.get_token(2).text)
    assert ('Berlin' == sentence.get_token(3).text)
    assert ('.' == sentence.get_token(4).text)

예제 #2

파일 보기

파일: tars_tagger_model.py 프로젝트: wyp19930313/flair

    def _get_tars_formatted_sentence(self, label, sentence):

        original_text = sentence.to_tokenized_string()

        label_text_pair = f"{label} {self.separator} {original_text}" if self.prefix \
            else f"{original_text} {self.separator} {label}"

        label_length = 0 if not self.prefix else len(label.split(" ")) + len(
            self.separator.split(" "))

        tars_sentence = Sentence(label_text_pair, use_tokenizer=False)

        for token in sentence:
            tag = token.get_tag(self.get_current_tag_type()).value

            if "-" in tag and tag.split('-')[1] == label:
                tars_tag = tag.split('-')[0] + '-'
            elif tag == label:
                tars_tag = "S-"
            else:
                tars_tag = "O"

            tars_sentence.get_token(token.idx + label_length).add_tag(
                self.static_label_type, tars_tag)

        return tars_sentence

예제 #3

파일 보기

파일: tars_model.py 프로젝트: sckevmit/flair

    def _get_tars_formatted_sentence(self, label, sentence):

        original_text = sentence.to_tokenized_string()

        label_text_pair = f"{label} {self.separator} {original_text}" if self.prefix \
            else f"{original_text} {self.separator} {label}"

        label_length = 0 if not self.prefix else len(label.split(" ")) + len(
            self.separator.split(" "))

        # make a tars sentence where all labels are O by default
        tars_sentence = Sentence(label_text_pair, use_tokenizer=False)
        for token in tars_sentence:
            token.add_tag(self.static_label_type, "O")

        # overwrite O labels with tags
        for token in sentence:
            tag = token.get_tag(self.get_current_label_type()).value

            if tag == "O" or tag == "":
                tars_tag = "O"
            elif tag == label:
                tars_tag = "S-"
            elif tag[1] == "-" and tag[2:] == label:
                tars_tag = tag.split('-')[0] + '-'
            else:
                tars_tag = "O"

            tars_sentence.get_token(token.idx + label_length).add_tag(
                self.static_label_type, tars_tag)

        return tars_sentence

예제 #4

파일 보기

    def _get_tars_formatted_sentence(self, label, sentence):

        original_text = sentence.to_tokenized_string()

        label_text_pair = (f"{label} {self.separator} {original_text}"
                           if self.prefix else
                           f"{original_text} {self.separator} {label}")

        label_length = 0 if not self.prefix else len(label.split(" ")) + len(
            self.separator.split(" "))

        # make a tars sentence where all labels are O by default
        tars_sentence = Sentence(label_text_pair, use_tokenizer=False)

        for entity_label in sentence.get_labels(self.label_type):
            if entity_label.value == label:
                new_span = [
                    tars_sentence.get_token(token.idx + label_length)
                    for token in entity_label.span
                ]
                tars_sentence.add_complex_label(
                    self.static_label_type,
                    SpanLabel(Span(new_span), value="entity"))

        return tars_sentence

예제 #5

파일 보기

from flair.data import Sentence
from flair.embeddings import WordEmbeddings
from flair.embeddings import CharacterEmbeddings
from flair.embeddings import BytePairEmbeddings
from flair.embeddings import BertEmbeddings, ELMoEmbeddings
from flair.embeddings import FlairEmbeddings, StackedEmbeddings

# 创建Sentense对象，Flair中共两个对象Sentense、token，sentense是由一系列token组成
sentence = Sentence('The grass is green .')
print(sentence)
print(sentence.get_token(4))
print(sentence[3])

# Glove Embeddings加载训练
glove_embedding_forward = WordEmbeddings('model/glove.gensim')
sentence = Sentence('The grass is green .')
glove_embedding_forward.embed(sentence)
for token in sentence:
    print(token)
    print(token.embedding)

#Fasttest Embedding加载训练
fasttext_embedding_forward = WordEmbeddings('model/zh-wiki-fasttext-300d-1M')
sentence = Sentence('The grass is green .')
fasttext_embedding_forward.embed(sentence)
for token in sentence:
    print(token)
    print(token.embedding)

#Flair Embedding加载训练
flair_embedding_forward = FlairEmbeddings('model/news-forward-0.4.1.pt')

예제 #6

파일 보기

파일: test_data.py 프로젝트: azawalich/flair

def test_sentence_get_item():
    sentence = Sentence('I love Berlin.', use_tokenizer=True)
    assert (sentence.get_token(1) == sentence[0])
    assert (sentence.get_token(3) == sentence[2])
    with pytest.raises(IndexError):
        token = sentence[4]