Python tokenize Exemples

Langage de programmation: Python

Espace de nommage/Pack: word_worker

Méthode/Fonction: tokenize

Exemples au hotexamples.com: 10

Python tokenize - 10 exemples trouvés. Ce sont les exemples réels les mieux notés de word_worker.tokenize extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Exemple #1

0

Afficher le fichier

Fichier : test_tokenize.py Projet : AzaubaevViktor/vk_grabber

def test_cleanup(): text = "МаМа мЫлА РаМу" wrong_chars = '!,+2=9^>.?}$§%*{/~&<±@:[\\]13456780#_`|' new_text = "" for ch in text: if ch == ' ': new_text += random.choice(wrong_chars) else: new_text += ch assert tokenize(text) == tokenize(new_text)

Exemple #2

0

Afficher le fichier

Fichier : word_.py Projet : AzaubaevViktor/vk_grabber

async def process(self, post: VKPost): for pos, word in enumerate(tokenize(post.text)): yield Word(word=word, post_id=post.id, owner_id=post.owner_id, date=post.date, position=pos)

Exemple #3

0

Afficher le fichier

Fichier : test_tokenize.py Projet : AzaubaevViktor/vk_grabber

def test_simple(): text = "Мама мыла раму" tokens = tokenize(text) assert len(tokens) == 3 assert tokens[0] == "мама" assert tokens[1] == "мыть" assert tokens[2] == "рама"

Exemple #4

0

Afficher le fichier

Fichier : test_tokenize.py Projet : AzaubaevViktor/vk_grabber

def test_minus_space(): assert [] == tokenize("- - -- - - - ")

Exemple #5

0

Afficher le fichier

Fichier : test_tokenize.py Projet : AzaubaevViktor/vk_grabber

def test_empty(): assert [] == tokenize("")

Exemple #6

0

Afficher le fichier

Fichier : test_tokenize.py Projet : AzaubaevViktor/vk_grabber

def test_none(): assert [] == tokenize(None)

Exemple #7

0

Afficher le fichier

Fichier : test_tokenize.py Projet : AzaubaevViktor/vk_grabber

def test_splitted_word(): text = "мама:мыла:раму" x = tokenize(text) assert x == ['мама', 'мыть', 'рама']

Exemple #8

0

Afficher le fichier

Fichier : test_tokenize.py Projet : AzaubaevViktor/vk_grabber

def test_new_line(): text = "мама\nмыла\nраму" x = tokenize(text) assert x == ['мама', 'мыть', 'рама']

Exemple #9

0

Afficher le fichier

Fichier : test_tokenize.py Projet : AzaubaevViktor/vk_grabber

def test_nsu(): text = "Я учусь в НГУ" tokens = tokenize(text) assert tokens == ["учиться", "нгу"]

Exemple #10

0

Afficher le fichier

Fichier : test_tokenize.py Projet : AzaubaevViktor/vk_grabber

def test_stopwords(): text = "я как-бы мы оно ага под" tokens = tokenize(text) assert not tokens