Ejemplos de preprocess_with_offsets en Python

Lenguaje de programación: Python

Namespace/Package Name: syntok.segmenter

Método / Función: preprocess_with_offsets

Ejemplos en hotexamples.com: 3

Python preprocess_with_offsets - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de syntok.segmenter.preprocess_with_offsets extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

 def test_preprocess_with_offsets(self):
     text = " ab\n \n cd- \n \n ef \n\n"
     result = segmenter.preprocess_with_offsets(text)
     self.assertListEqual([(0, " ab"), (6, " cd- "), (14, " ef "), (20, "")], result)

Ejemplo n.º 2

Mostrar archivo

    def _analyze(self, document: str, bracket_skip_len=None) -> Iterator[Iterator[List[Token]]]:
        tok = Tokenizer(replace_not_contraction=False, emit_hyphen_or_underscore_sep=True)

        for offset, paragraph in segmenter.preprocess_with_offsets(document):
            tokens = tok.tokenize(paragraph, offset)
            yield segmenter.segment(tokens, bracket_skip_len)

Ejemplo n.º 3

Mostrar archivo

 def test_preprocess_with_offsets(self):
     text = " ab\n\u00a0 \n cd- \n ef \n\n g \n \n"
     result = segmenter.preprocess_with_offsets(text)
     self.assertListEqual([(0, " ab"), (7, " cd- \n ef "), (19, " g "),
                           (25, "")], result)