Python Tokenizer примеры использования

Язык программирования: Python

Пространство имен/Пакет: vunit.parsing.tokenizer

Класс/Тип: Tokenizer

Примеров на hotexamples.com: 4

Python Tokenizer - 4 примера найдено. Это лучшие примеры Python кода для vunit.parsing.tokenizer.Tokenizer, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Tokenizer(1)

add(1)

finalize(1)

tokenize(1)

Пример #1

Показать файл

Файл: tokenizer.py Проект: tivaliy/vunit

    def __init__(self, create_locations=True):
        self._tokenizer = Tokenizer()
        self._create_locations = create_locations

        def slice_value(token, start=None, end=None):
            return Token(token.kind, token.value[start:end], token.location)

        def remove_value(token):
            return Token(token.kind, '', token.location)

        def ignore_value(token):  # pylint: disable=unused-argument
            return None

        def add(kind, regex, func=None):
            self._tokenizer.add(kind, regex, func)

        def replace_keywords(token):  # pylint: disable=missing-docstring
            if token.value in KEYWORDS:
                return Token(KEYWORDS[token.value], '', token.location)

            return token

        add(PREPROCESSOR, r"`[a-zA-Z][a-zA-Z0-9_]*",
            lambda token: slice_value(token, start=1))

        add(STRING, r'(?<!\\)"(.*?)(?<!\\)"',
            lambda token: slice_value(token, start=1, end=-1))

        add(COMMENT, r'//.*$', lambda token: slice_value(token, start=2))

        add(IDENTIFIER, r"[a-zA-Z_][a-zA-Z0-9_]*", replace_keywords)

        add(ESCAPED_NEWLINE, r"\\\n", ignore_value)

        add(NEWLINE, r"\n", remove_value)

        add(WHITESPACE, r"\s +")

        add(MULTI_COMMENT, r"/\*(.|\n)*?\*/",
            lambda token: slice_value(token, start=2, end=-2))

        add(DOUBLE_COLON, r"::", remove_value)

        add(SEMI_COLON, r";", remove_value)

        add(HASH, r"\#", remove_value)

        add(EQUAL, r"=", remove_value)

        add(LPAR, r"\(", remove_value)

        add(RPAR, r"\)", remove_value)

        add(COMMA, r",", remove_value)

        add(OTHER, r".+?")

        self._tokenizer.finalize()

Пример #2

Показать файл

    def __init__(self, create_locations=True):
        self._tokenizer = Tokenizer()
        self._create_locations = create_locations

        def slice_value(token, start=None, end=None):
            return Token(token.kind, token.value[start:end], token.location)

        def str_value(token):
            return Token(token.kind,
                         token.value[1:-1].replace("\\\n", "").replace("\\\"", "\""),
                         token.location)

        def remove_value(token):
            return Token(token.kind, '', token.location)

        def ignore_value(token):  # pylint: disable=unused-argument
            pass

        def add(kind, regex, func=None):
            self._tokenizer.add(kind, regex, func)

        def replace_keywords(token):  # pylint: disable=missing-docstring
            if token.value in KEYWORDS:
                return Token(KEYWORDS[token.value], '', token.location)

            return token

        add(PREPROCESSOR,
            r"`[a-zA-Z][a-zA-Z0-9_]*",
            lambda token: slice_value(token, start=1))

        add(STRING,
            r'(?<!\\)"((.|\n)*?)(?<!\\)"',
            str_value)

        add(COMMENT,
            r'//.*$',
            lambda token: slice_value(token, start=2))

        add(IDENTIFIER,
            r"[a-zA-Z_][a-zA-Z0-9_]*",
            replace_keywords)

        add(ESCAPED_NEWLINE,
            r"\\\n",
            ignore_value)

        add(NEWLINE,
            r"\n",
            remove_value)

        add(WHITESPACE,
            r"\s +")

        add(MULTI_COMMENT,
            r"/\*(.|\n)*?\*/",
            lambda token: slice_value(token, start=2, end=-2))

        add(DOUBLE_COLON,
            r"::",
            remove_value)

        add(COLON,
            r":",
            remove_value)

        add(SEMI_COLON,
            r";",
            remove_value)

        add(HASH,
            r"\#",
            remove_value)

        add(EQUAL,
            r"=",
            remove_value)

        add(LPAR,
            r"\(",
            remove_value)

        add(RPAR,
            r"\)",
            remove_value)

        add(LBRACKET,
            r"\[",
            remove_value)

        add(RBRACKET,
            r"\]",
            remove_value)

        add(LBRACE,
            r"{",
            remove_value)

        add(RBRACE,
            r"}",
            remove_value)

        add(COMMA,
            r",",
            remove_value)

        add(OTHER,
            r".+?")

        self._tokenizer.finalize()

Пример #3

Показать файл

Файл: tokenizer.py Проект: wzab/vunit

class VerilogTokenizer(object):
    """
    A Verilog tokenizer
    """
    def __init__(self, create_locations=True):
        self._tokenizer = Tokenizer()
        self._create_locations = create_locations

        def slice_value(token, start=None, end=None):
            return Token(token.kind, token.value[start:end], token.location)

        def str_value(token):
            return Token(
                token.kind,
                token.value[1:-1].replace("\\\n", "").replace("\\\"", "\""),
                token.location)

        def remove_value(token):
            return Token(token.kind, '', token.location)

        def ignore_value(token):  # pylint: disable=unused-argument
            pass

        def add(kind, regex, func=None):
            self._tokenizer.add(kind, regex, func)

        def replace_keywords(token):  # pylint: disable=missing-docstring
            if token.value in KEYWORDS:
                return Token(KEYWORDS[token.value], '', token.location)

            return token

        add(PREPROCESSOR, r"`[a-zA-Z][a-zA-Z0-9_]*",
            lambda token: slice_value(token, start=1))

        add(STRING, r'(?<!\\)"((.|\n)*?)(?<!\\)"', str_value)

        add(COMMENT, r'//.*$', lambda token: slice_value(token, start=2))

        add(IDENTIFIER, r"[a-zA-Z_][a-zA-Z0-9_]*", replace_keywords)

        add(ESCAPED_NEWLINE, r"\\\n", ignore_value)

        add(NEWLINE, r"\n", remove_value)

        add(WHITESPACE, r"\s +")

        add(MULTI_COMMENT, r"/\*(.|\n)*?\*/",
            lambda token: slice_value(token, start=2, end=-2))

        add(DOUBLE_COLON, r"::", remove_value)

        add(COLON, r":", remove_value)

        add(SEMI_COLON, r";", remove_value)

        add(HASH, r"\#", remove_value)

        add(EQUAL, r"=", remove_value)

        add(LPAR, r"\(", remove_value)

        add(RPAR, r"\)", remove_value)

        add(LBRACKET, r"\[", remove_value)

        add(RBRACKET, r"\]", remove_value)

        add(LBRACE, r"{", remove_value)

        add(RBRACE, r"}", remove_value)

        add(COMMA, r",", remove_value)

        add(OTHER, r".+?")

        self._tokenizer.finalize()

    def tokenize(self, code, file_name=None, previous_location=None):
        """
        Tokenize Verilog code to be preprocessed
        """

        return self._tokenizer.tokenize(
            code=code,
            file_name=file_name,
            previous_location=previous_location,
            create_locations=self._create_locations)

Пример #4

Показать файл

Файл: tokenizer.py Проект: KevinKes/vunit

class VerilogTokenizer(object):
    """
    A Verilog tokenizer
    """

    def __init__(self, create_locations=True):
        self._tokenizer = Tokenizer()
        self._create_locations = create_locations

        def slice_value(token, start=None, end=None):
            return Token(token.kind, token.value[start:end], token.location)

        def remove_value(token):
            return Token(token.kind, '', token.location)

        def ignore_value(token):  # pylint: disable=unused-argument
            return None

        def add(kind, regex, func=None):
            self._tokenizer.add(kind, regex, func)

        def replace_keywords(token):
            if token.value in KEYWORDS:
                return Token(KEYWORDS[token.value], '', token.location)
            else:
                return token

        add(PREPROCESSOR,
            r"`[a-zA-Z][a-zA-Z0-9_]*",
            lambda token: slice_value(token, start=1))

        add(STRING,
            r'(?<!\\)"(.*?)(?<!\\)"',
            lambda token: slice_value(token, start=1, end=-1))

        add(COMMENT,
            r'//.*$',
            lambda token: slice_value(token, start=2))

        add(IDENTIFIER,
            r"[a-zA-Z_][a-zA-Z0-9_]*",
            replace_keywords)

        add(ESCAPED_NEWLINE,
            r"\\\n",
            ignore_value)

        add(NEWLINE,
            r"\n",
            remove_value)

        add(WHITESPACE,
            r"\s +")

        add(MULTI_COMMENT,
            r"/\*(.|\n)*?\*/",
            lambda token: slice_value(token, start=2, end=-2))

        add(DOUBLE_COLON,
            r"::",
            remove_value)

        add(SEMI_COLON,
            r";",
            remove_value)

        add(HASH,
            r"\#",
            remove_value)

        add(EQUAL,
            r"=",
            remove_value)

        add(LPAR,
            r"\(",
            remove_value)

        add(RPAR,
            r"\)",
            remove_value)

        add(COMMA,
            r",",
            remove_value)

        add(OTHER,
            r".+?")

        self._tokenizer.finalize()

    def tokenize(self, code, file_name=None, previous_location=None):
        """
        Tokenize Verilog code to be preprocessed
        """

        return self._tokenizer.tokenize(code=code,
                                        file_name=file_name,
                                        previous_location=previous_location,
                                        create_locations=self._create_locations)