Python PythonTokenizer示例

编程语言: Python

命名空间/包名称: cubert.python_tokenizer

方法/功能: PythonTokenizer

hotexamples.com的示例: 11

Python PythonTokenizer - 已找到11个示例。这些是从开源项目中提取的最受好评的cubert.python_tokenizer.PythonTokenizer现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： python_tokenizer_test.py 项目： zrqohbug/google-research

 def test_python_tokenize_returns_expected(self, types_to_skip, source,
                                           expected):
     tokenizer = python_tokenizer.PythonTokenizer()
     if types_to_skip is not None:
         tokenizer.update_types_to_skip(types_to_skip)
     actual = tokenizer.tokenize(source)
     self.assertListEqual(expected, actual)

示例#2

显示文件

 def setUp(self):
     super().setUp()
     self.tokenizer = python_tokenizer.PythonTokenizer()
     subword_vocabulary_path = self.create_tempfile(
         content=self._VOCABULARY_CONTENT).full_path
     self.subword_text_encoder = text_encoder.SubwordTextEncoder(
         subword_vocabulary_path)

示例#3

显示文件

文件： python_tokenizer_test.py 项目： zrqohbug/google-research

    def test_python_tokenize_abstract_returns_positioning(
            self, source, expected_positions_and_kinds):
        tokenizer = python_tokenizer.PythonTokenizer()

        agnostic = tokenizer.tokenize_and_abstract(source)
        actual_positions_and_kinds = tuple(
            (m.metadata.start.line, m.metadata.start.column,
             m.metadata.end.line, m.metadata.end.column, m.kind)
            for m in agnostic)

        self.assertSequenceEqual(expected_positions_and_kinds,
                                 actual_positions_and_kinds)

示例#4

显示文件

文件： python_tokenizer_test.py 项目： zrqohbug/google-research

 def test_python_tokenize_raises_on_unknown_python_token_kind(
         self, unused_function_mock):
     tokenizer = python_tokenizer.PythonTokenizer()
     with self.assertRaisesRegex(ValueError, 'While trying to turn'):
         tokenizer.tokenize('source')

示例#5

显示文件

文件： python_tokenizer_test.py 项目： zrqohbug/google-research

 def test_python_untokenize_raises_as_expected(self, tokens):
     tokenizer = python_tokenizer.PythonTokenizer()
     with self.assertRaises(ValueError):
         tokenizer.untokenize(tokens)

示例#6

显示文件

文件： python_tokenizer_test.py 项目： zrqohbug/google-research

 def test_python_with_comment_roundtrip(self, source, expected):
     tokenizer = python_tokenizer.PythonTokenizer()
     tokenizer.update_types_to_skip([])
     self.assertEqual(expected,
                      tokenizer.untokenize(tokenizer.tokenize(source)))

示例#7

显示文件

文件： python_tokenizer_test.py 项目： zrqohbug/google-research

 def test_python_roundtrip(self, source, expected):
     tokenizer = python_tokenizer.PythonTokenizer()
     self.assertEqual(expected,
                      tokenizer.untokenize(tokenizer.tokenize(source)))

示例#8

显示文件

文件： python_tokenizer_test.py 项目： zrqohbug/google-research

 def test_python_tokenize_respects_mappings(self, mappings, source,
                                            expected):
     tokenizer = python_tokenizer.PythonTokenizer()
     tokenizer.update_mappings(mappings)
     actual = tokenizer.tokenize(source)
     self.assertListEqual(expected, actual)

示例#9

显示文件

文件： python_tokenizer_test.py 项目： zrqohbug/google-research

 def test_python_tokenize_respects_reserved(self, reserved, source,
                                            expected):
     tokenizer = python_tokenizer.PythonTokenizer()
     tokenizer.replace_reserved_keywords(reserved)
     actual = tokenizer.tokenize(source)
     self.assertListEqual(expected, actual)

示例#10

显示文件

文件： python_tokenizer_test.py 项目： zrqohbug/google-research

 def test_python_tokenize_handles_tokenization_errors(self, bad_code):
     tokenizer = python_tokenizer.PythonTokenizer()
     actual = tokenizer.tokenize(bad_code)
     self.assertListEqual([_ERROR_NAME, _EOS_NAME], actual)

示例#11

显示文件

 def test_python_tokenize_handles_tokenization_errors(self, bad_code):
     tokenizer = python_tokenizer.PythonTokenizer()
     tokenizer.replace_reserved_keywords(('___ERROR___', ))
     actual = tokenizer.tokenize(bad_code)
     self.assertListEqual([_ERROR_NAME, _EOS_NAME], actual)