Python preprocess_with_offsetsの例

プログラミング言語: Python

名前空間/パッケージ名: syntok.segmenter

メソッド/関数: preprocess_with_offsets

hotexamples.comのコード掲載数: 3

Python preprocess_with_offsets - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのsyntok.segmenter.preprocess_with_offsetsの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

 def test_preprocess_with_offsets(self):
     text = " ab\n \n cd- \n \n ef \n\n"
     result = segmenter.preprocess_with_offsets(text)
     self.assertListEqual([(0, " ab"), (6, " cd- "), (14, " ef "), (20, "")], result)

コード例 #2

ファイルを表示

    def _analyze(self, document: str, bracket_skip_len=None) -> Iterator[Iterator[List[Token]]]:
        tok = Tokenizer(replace_not_contraction=False, emit_hyphen_or_underscore_sep=True)

        for offset, paragraph in segmenter.preprocess_with_offsets(document):
            tokens = tok.tokenize(paragraph, offset)
            yield segmenter.segment(tokens, bracket_skip_len)

コード例 #3

ファイルを表示

 def test_preprocess_with_offsets(self):
     text = " ab\n\u00a0 \n cd- \n ef \n\n g \n \n"
     result = segmenter.preprocess_with_offsets(text)
     self.assertListEqual([(0, " ab"), (7, " cd- \n ef "), (19, " g "),
                           (25, "")], result)