Python tokenizeの例

プログラミング言語: Python

名前空間/パッケージ名: word_worker

メソッド/関数: tokenize

hotexamples.comのコード掲載数: 10

Python tokenize - 10件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのword_worker.tokenizeの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: test_tokenize.py プロジェクト: AzaubaevViktor/vk_grabber

def test_cleanup():
    text = "МаМа мЫлА РаМу"

    wrong_chars = '!,+2=9^>.?}$§%*{/~&<±@:[\\]13456780#_`|'

    new_text = ""

    for ch in text:
        if ch == ' ':
            new_text += random.choice(wrong_chars)
        else:
            new_text += ch

    assert tokenize(text) == tokenize(new_text)

コード例 #2

ファイルを表示

ファイル: word_.py プロジェクト: AzaubaevViktor/vk_grabber

 async def process(self, post: VKPost):
     for pos, word in enumerate(tokenize(post.text)):
         yield Word(word=word,
                    post_id=post.id,
                    owner_id=post.owner_id,
                    date=post.date,
                    position=pos)

コード例 #3

ファイルを表示

ファイル: test_tokenize.py プロジェクト: AzaubaevViktor/vk_grabber

def test_simple():
    text = "Мама мыла раму"

    tokens = tokenize(text)

    assert len(tokens) == 3

    assert tokens[0] == "мама"
    assert tokens[1] == "мыть"
    assert tokens[2] == "рама"

コード例 #4

ファイルを表示

ファイル: test_tokenize.py プロジェクト: AzaubaevViktor/vk_grabber

def test_minus_space():
    assert [] == tokenize("-  - -- -   - - ")

コード例 #5

ファイルを表示

ファイル: test_tokenize.py プロジェクト: AzaubaevViktor/vk_grabber

def test_empty():
    assert [] == tokenize("")

コード例 #6

ファイルを表示

ファイル: test_tokenize.py プロジェクト: AzaubaevViktor/vk_grabber

def test_none():
    assert [] == tokenize(None)

コード例 #7

ファイルを表示

ファイル: test_tokenize.py プロジェクト: AzaubaevViktor/vk_grabber

def test_splitted_word():
    text = "мама:мыла:раму"
    x = tokenize(text)
    assert x == ['мама', 'мыть', 'рама']

コード例 #8

ファイルを表示

ファイル: test_tokenize.py プロジェクト: AzaubaevViktor/vk_grabber

def test_new_line():
    text = "мама\nмыла\nраму"

    x = tokenize(text)
    assert x == ['мама', 'мыть', 'рама']

コード例 #9

ファイルを表示

ファイル: test_tokenize.py プロジェクト: AzaubaevViktor/vk_grabber

def test_nsu():
    text = "Я учусь в НГУ"

    tokens = tokenize(text)

    assert tokens == ["учиться", "нгу"]

コード例 #10

ファイルを表示

ファイル: test_tokenize.py プロジェクト: AzaubaevViktor/vk_grabber

def test_stopwords():
    text = "я как-бы мы оно ага под"

    tokens = tokenize(text)

    assert not tokens