Python WordTokenizer.tokenizeの例

プログラミング言語: Python

名前空間/パッケージ名: sciwing.tokenizers.word_tokenizer

クラス/型: WordTokenizer

メソッド/関数: tokenize

hotexamples.comのコード掲載数: 4

Python WordTokenizer.tokenize - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのsciwing.tokenizers.word_tokenizer.WordTokenizer.tokenizeの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

WordTokenizer(30)

tokenize(4)

nlp(2)

tokenize_batch(2)

コード例 #1

ファイルを表示

ファイル: test_tokenizer.py プロジェクト: yyht/sciwing

 def test_spacy_whitespace_tokenizer(self):
     tokenizer = WordTokenizer(tokenizer="spacy-whitespace")
     tokenized = tokenizer.tokenize(
         "(1999). & P., W. The Control of Discrete Event Systems.")
     assert tokenized == [
         "(1999).",
         "&",
         "P.,",
         "W.",
         "The",
         "Control",
         "of",
         "Discrete",
         "Event",
         "Systems.",
     ]

コード例 #2

ファイルを表示

ファイル: test_tokenizer.py プロジェクト: yyht/sciwing

 def test_other_tokenizer(self):
     tokenizer = WordTokenizer(tokenizer="nltk")
     assert tokenizer.tokenize("First string") is None

コード例 #3

ファイルを表示

ファイル: test_tokenizer.py プロジェクト: yyht/sciwing

    def test_sample_word_tokenization(self):
        sample_sentence = "I like big apple."
        tokenizer = WordTokenizer()
        tokens = tokenizer.tokenize(sample_sentence)

        assert tokens == ["I", "like", "big", "apple", "."]

コード例 #4

ファイルを表示

ファイル: test_tokenizer.py プロジェクト: yyht/sciwing

    def test_sample_apostrophe_tokenization(self):
        sample_sentence = "I don't like apples."
        tokenizer = WordTokenizer()
        tokens = tokenizer.tokenize(sample_sentence)

        assert tokens == ["I", "do", "n't", "like", "apples", "."]