Exemplos de Tokenizer.add_special_case em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: spacy.tokenizer

Classe / Tipo: Tokenizer

Método / Função: add_special_case

Exemplos em hotexamples.com: 4

Tokenizer.add_special_case em Python - 4 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de spacy.tokenizer.Tokenizer.add_special_case em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

Tokenizer(30)

pipe(15)

explain(4)

rules(3)

to_bytes(3)

add_special_case(3)

token_match(2)

from_dir(2)

from_disk(2)

suffix_search(2)

to_disk(1)

load(1)

prefix_search(1)

infix_finditer(1)

from_bytes(1)

encode(1)

batch_encode_plus(1)

tokens_from_list(1)

Métodos Frequentes

Tokenizer (30)

pipe (15)

explain (4)

rules (3)

to_bytes (3)

add_special_case (3)

token_match (2)

from_dir (2)

from_disk (2)

suffix_search (2)

Métodos Frequentes

to_disk (1)

load (1)

prefix_search (1)

infix_finditer (1)

from_bytes (1)

encode (1)

batch_encode_plus (1)

tokens_from_list (1)

Exemplo n.º 1

0

Exibir arquivo

def test_tokenizer_add_special_case_tag(text, tokens): vocab = Vocab() tokenizer = Tokenizer(vocab, {}, None, None, None) tokenizer.add_special_case(text, tokens) doc = tokenizer(text) assert doc[0].text == tokens[0]["orth"] assert doc[0].norm_ == tokens[0]["norm"] assert doc[1].text == tokens[1]["orth"]

Exemplo n.º 2

0

Exibir arquivo

Arquivo: test_tokenizer.py Projeto: spacy-io/spaCy

def test_tokenizer_add_special_case_tag(text, tokens): vocab = Vocab(tag_map={"NN": {"pos": "NOUN"}}) tokenizer = Tokenizer(vocab, {}, None, None, None) tokenizer.add_special_case(text, tokens) doc = tokenizer(text) assert doc[0].text == tokens[0]["orth"] assert doc[0].tag_ == tokens[0]["tag"] assert doc[0].pos_ == "NOUN" assert doc[1].text == tokens[1]["orth"]

Exemplo n.º 3

0

Exibir arquivo

def test_tokenizer_add_special_case_tag(text, tokens): vocab = Vocab(tag_map={"NN": {"pos": "NOUN"}}) tokenizer = Tokenizer(vocab, {}, None, None, None) tokenizer.add_special_case(text, tokens) doc = tokenizer(text) assert doc[0].text == tokens[0]["orth"] assert doc[0].tag_ == tokens[0]["tag"] assert doc[0].pos_ == "NOUN" assert doc[1].text == tokens[1]["orth"]

Exemplo n.º 4

0

Exibir arquivo

""" References: 1. https://spacy.io/api/tokenizer 1. https://github.com/explosion/spaCy/issues/396 """ import spacy nlp = spacy.load('en_core_web_lg') from spacy.attrs import ORTH, LEMMA from spacy.tokenizer import Tokenizer exceptions = [{"us": [{ORTH: "us"}, {ORTH: "-east", LEMMA: "east"}]}] tokenizer = Tokenizer(nlp.vocab) tokenizer.add_special_case("""us-east-1""", exceptions)