Python split_possessive_markers Exemples

Langage de programmation: Python

Espace de nommage/Pack: segtok.tokenizer

Méthode/Fonction: split_possessive_markers

Exemples au hotexamples.com: 8

Python split_possessive_markers - 8 exemples trouvés. Ce sont les exemples réels les mieux notés de segtok.tokenizer.split_possessive_markers extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Associées

DonorInput

get_redirect_url

run_feasibility

Unpacker

WildDict

getExitOrder

extract_subjects

ProjectQueue

show

execute

Related in langs

get_useragent_info (PHP)

PhpSigep\Model\Destinatario (PHP)

SequenceStartedEventArgs (C#)

imp_catalogo (C#)

RTTestSetDefault (C++)

SMB_VFS_CLOSE (C++)

GetString (Go)

SetComment (Go)

ResolvableDeserializer (Java)

BoundedRangeModel (Java)

Exemple #1

0

Afficher le fichier

Fichier : tokenizer_test.py Projet : fnl/segtok

def test_split_with_s(self): result = split_possessive_markers(["Fred's", 'is', "Frank's", 'bar', '.']) self.assertEqual(7, len(result), str(result)) self.assertEqual(result[0], "Fred", str(result)) self.assertEqual(result[1], "'s", str(result)) self.assertEqual(result[3], "Frank", str(result)) self.assertEqual(result[4], "'s", str(result))

Exemple #2

0

Afficher le fichier

def test_split_with_s(self): result = split_possessive_markers( ["Fred's", 'is', "Frank's", 'bar', '.']) self.assertEqual(7, len(result), str(result)) self.assertEqual(result[0], "Fred", str(result)) self.assertEqual(result[1], "'s", str(result)) self.assertEqual(result[3], "Frank", str(result)) self.assertEqual(result[4], "'s", str(result))

Exemple #3

0

Afficher le fichier

def word_tokenize(self, text): """Get list of string tokens from input string. Args: text: input string for tokenization Yields: token: str, non-whitespace tokens """ for token in split_possessive_markers(split_contractions(_html_tokenize(text))): if self._max_characters_per_token is not None: for token_chunk in funcy.chunks(self._max_characters_per_token, token): yield token_chunk else: yield token

Exemple #4

0

Afficher le fichier

Fichier : tokenizer_test.py Projet : fnl/segtok

def test_split_unicode(self): stem, marker = split_possessive_markers(["a\u2032s"]) self.assertEqual(stem, 'a') self.assertEqual(marker, "\u2032s")

Exemple #5

0

Afficher le fichier

Fichier : tokenizer_test.py Projet : fnl/segtok

def test_split_without_s(self): stem, marker = split_possessive_markers(["CHARLES'"]) self.assertEqual(stem, "CHARLES") self.assertEqual(marker, "'")

Exemple #6

0

Afficher le fichier

def test_split_unicode(self): stem, marker = split_possessive_markers(["a\u2032s"]) self.assertEqual(stem, 'a') self.assertEqual(marker, "\u2032s")

Exemple #7

0

Afficher le fichier

def test_split_without_s(self): stem, marker = split_possessive_markers(["CHARLES'"]) self.assertEqual(stem, "CHARLES") self.assertEqual(marker, "'")

Exemple #8

0

Afficher le fichier

def setUp(self): self.tokenizer = test_tokenizer_with_spans( self, lambda t: split_possessive_markers(space_tokenizer(t)))