Python Tokenizer.parse примеры использования

Язык программирования: Python

Пространство имен/Пакет: janome.tokenizer

Класс/Тип: Tokenizer

Метод/Функция: parse

Примеров на hotexamples.com: 1

Python Tokenizer.parse - 1 пример найден. Это лучшие примеры Python кода для janome.tokenizer.Tokenizer.parse, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Tokenizer(30)

tokenize(30)

__init__(1)

index(1)

parse(1)

pop(1)

Пример #1

Показать файл

class JapaneseTokenizer(BaseEstimator, TransformerMixin):
    def __init__(self, parser_type='MeCab'):
        self.parser_type = parser_type

        if self.parser_type == 'MeCab':
            import MeCab
            self.tokenizer = MeCab.Tagger('-Owakati')
        elif self.parser_type == 'janome':
            from janome.tokenizer import Tokenizer
            self.tokenizer = Tokenizer()
        else:
            raise ValueError("parser_type should be 'MeCab' or 'janome'")

    def fit(self, X, y=None):
        return self

    def transform(self, X):
        if self.parser_type == 'MeCab':
            return self.tokenizer.parse(X).split(' ')[:-1]
        elif self.parser_type == 'janome':
            return self.tokenizer.tokenize(X, wakati=True)