Python Tokenizer.add_special_case Exemples

Langage de programmation: Python

Espace de nommage/Pack: spacy.tokenizer

Class/Type: Tokenizer

Méthode/Fonction: add_special_case

Exemples au hotexamples.com: 4

Python Tokenizer.add_special_case - 4 exemples trouvés. Ce sont les exemples réels les mieux notés de spacy.tokenizer.Tokenizer.add_special_case extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Tokenizer(30)

pipe(15)

explain(4)

rules(3)

to_bytes(3)

add_special_case(3)

token_match(2)

from_dir(2)

from_disk(2)

suffix_search(2)

to_disk(1)

load(1)

prefix_search(1)

infix_finditer(1)

from_bytes(1)

encode(1)

batch_encode_plus(1)

tokens_from_list(1)

Méthodes fréquemment utilisées

Tokenizer (30)

pipe (15)

explain (4)

rules (3)

to_bytes (3)

add_special_case (3)

token_match (2)

from_dir (2)

from_disk (2)

suffix_search (2)

Méthodes fréquemment utilisées

to_disk (1)

load (1)

prefix_search (1)

infix_finditer (1)

from_bytes (1)

encode (1)

batch_encode_plus (1)

tokens_from_list (1)

Exemple #1

0

Afficher le fichier

def test_tokenizer_add_special_case_tag(text, tokens): vocab = Vocab() tokenizer = Tokenizer(vocab, {}, None, None, None) tokenizer.add_special_case(text, tokens) doc = tokenizer(text) assert doc[0].text == tokens[0]["orth"] assert doc[0].norm_ == tokens[0]["norm"] assert doc[1].text == tokens[1]["orth"]

Exemple #2

0

Afficher le fichier

Fichier : test_tokenizer.py Projet : spacy-io/spaCy

def test_tokenizer_add_special_case_tag(text, tokens): vocab = Vocab(tag_map={"NN": {"pos": "NOUN"}}) tokenizer = Tokenizer(vocab, {}, None, None, None) tokenizer.add_special_case(text, tokens) doc = tokenizer(text) assert doc[0].text == tokens[0]["orth"] assert doc[0].tag_ == tokens[0]["tag"] assert doc[0].pos_ == "NOUN" assert doc[1].text == tokens[1]["orth"]

Exemple #3

0

Afficher le fichier

def test_tokenizer_add_special_case_tag(text, tokens): vocab = Vocab(tag_map={"NN": {"pos": "NOUN"}}) tokenizer = Tokenizer(vocab, {}, None, None, None) tokenizer.add_special_case(text, tokens) doc = tokenizer(text) assert doc[0].text == tokens[0]["orth"] assert doc[0].tag_ == tokens[0]["tag"] assert doc[0].pos_ == "NOUN" assert doc[1].text == tokens[1]["orth"]

Exemple #4

0

Afficher le fichier

""" References: 1. https://spacy.io/api/tokenizer 1. https://github.com/explosion/spaCy/issues/396 """ import spacy nlp = spacy.load('en_core_web_lg') from spacy.attrs import ORTH, LEMMA from spacy.tokenizer import Tokenizer exceptions = [{"us": [{ORTH: "us"}, {ORTH: "-east", LEMMA: "east"}]}] tokenizer = Tokenizer(nlp.vocab) tokenizer.add_special_case("""us-east-1""", exceptions)