Ejemplos de index_tokenizer en Python

Lenguaje de programación: Python

Namespace/Package Name: licensedcode.tokenize

Método / Función: index_tokenizer

Ejemplos en hotexamples.com: 3

Python index_tokenizer - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de licensedcode.tokenize.index_tokenizer extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

Archivo: test_tokenize.py Proyecto: sthagen/scancode-toolkit

 def test_index_tokenizer_lines_on_html_like_texts_2(
         self, regen=REGEN_TEST_FIXTURES):
     test_file = self.get_test_loc('tokenize/htmlish.html')
     expected_file = test_file + '.expected.index_tokenizer.json'
     lines = query_lines(test_file)
     result = [list(index_tokenizer(line)) for _ln, line in lines]
     check_results(result, expected_file, regen=regen)

Ejemplo n.º 2

Mostrar archivo

Archivo: test_tokenize.py Proyecto: Siddhant-K-code/scancode-toolkit

    def test_key_phrase_tokenizer_returns_same_word_tokens_as_index_tokenizer(self):
        """
        It is important that the `key_phrase_tokenizer` returns the same amount
        of tokens (excluding key_phrase markup) as the `index_tokenizer` so that
        they Span positions derived from the tokens line up.
        """
        text = 'Redistribution \n\n comma and   use in \n\t binary \xe4r till\xe5tet.'

        key_phrase_tokens = key_phrase_tokenizer(text)
        index_tokens = index_tokenizer(text)

        assert list(key_phrase_tokens) == list(index_tokens)

Ejemplo n.º 3

Mostrar archivo

Archivo: test_tokenize.py Proyecto: akugarg/scancode-toolkit

 def test_index_tokenizer_on_html_like_texts(self, regen=False):
     test_file = self.get_test_loc('tokenize/htmlish.txt')
     expected_file = test_file + '.expected.index_tokenizer.json'
     lines = query_lines(test_file)
     result = [list(index_tokenizer(line)) for _ln, line in lines]
     check_results(result, expected_file, regen=regen)