Python tokenize Examples

Programming Language: Python

Namespace/Package Name: word_worker

Method/Function: tokenize

Examples at hotexamples.com: 10

Python tokenize - 10 examples found. These are the top rated real world Python examples of word_worker.tokenize extracted from open source projects. You can rate examples to help us improve the quality of examples.

Example #1

Show file

File: test_tokenize.py Project: AzaubaevViktor/vk_grabber

def test_cleanup():
    text = "МаМа мЫлА РаМу"

    wrong_chars = '!,+2=9^>.?}$§%*{/~&<±@:[\\]13456780#_`|'

    new_text = ""

    for ch in text:
        if ch == ' ':
            new_text += random.choice(wrong_chars)
        else:
            new_text += ch

    assert tokenize(text) == tokenize(new_text)

Example #2

Show file

File: word_.py Project: AzaubaevViktor/vk_grabber

 async def process(self, post: VKPost):
     for pos, word in enumerate(tokenize(post.text)):
         yield Word(word=word,
                    post_id=post.id,
                    owner_id=post.owner_id,
                    date=post.date,
                    position=pos)

Example #3

Show file

File: test_tokenize.py Project: AzaubaevViktor/vk_grabber

def test_simple():
    text = "Мама мыла раму"

    tokens = tokenize(text)

    assert len(tokens) == 3

    assert tokens[0] == "мама"
    assert tokens[1] == "мыть"
    assert tokens[2] == "рама"

Example #4

Show file

File: test_tokenize.py Project: AzaubaevViktor/vk_grabber

def test_minus_space():
    assert [] == tokenize("-  - -- -   - - ")

Example #5

Show file

File: test_tokenize.py Project: AzaubaevViktor/vk_grabber

def test_empty():
    assert [] == tokenize("")

Example #6

Show file

File: test_tokenize.py Project: AzaubaevViktor/vk_grabber

def test_none():
    assert [] == tokenize(None)

Example #7

Show file

File: test_tokenize.py Project: AzaubaevViktor/vk_grabber

def test_splitted_word():
    text = "мама:мыла:раму"
    x = tokenize(text)
    assert x == ['мама', 'мыть', 'рама']

Example #8

Show file

File: test_tokenize.py Project: AzaubaevViktor/vk_grabber

def test_new_line():
    text = "мама\nмыла\nраму"

    x = tokenize(text)
    assert x == ['мама', 'мыть', 'рама']

Example #9

Show file

File: test_tokenize.py Project: AzaubaevViktor/vk_grabber

def test_nsu():
    text = "Я учусь в НГУ"

    tokens = tokenize(text)

    assert tokens == ["учиться", "нгу"]

Example #10

Show file

File: test_tokenize.py Project: AzaubaevViktor/vk_grabber

def test_stopwords():
    text = "я как-бы мы оно ага под"

    tokens = tokenize(text)

    assert not tokens