Python WordTokenizer.tokenize_batch примеры использования

Язык программирования: Python

Пространство имен/Пакет: sciwing.tokenizers.word_tokenizer

Класс/Тип: WordTokenizer

Метод/Функция: tokenize_batch

Примеров на hotexamples.com: 2

Python WordTokenizer.tokenize_batch - 2 примера найдено. Это лучшие примеры Python кода для sciwing.tokenizers.word_tokenizer.WordTokenizer.tokenize_batch, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

WordTokenizer(30)

tokenize(4)

nlp(2)

tokenize_batch(2)

Пример #1

Показать файл

Файл: test_pipeline_till_numericalization.py Проект: yyht/sciwing

def get_tokenized_data(get_parsect_data):
    parsect_json = get_parsect_data
    parsect_lines = parsect_json["parse_sect"]
    parsect_lines = parsect_lines[:100]
    tokenizer = WordTokenizer()

    lines = []
    labels = []

    for line_json in parsect_lines:
        text = line_json["text"]
        label = line_json["label"]
        lines.append(text)
        labels.append(label)

    instances = tokenizer.tokenize_batch(lines)

    return instances, labels

Пример #2

Показать файл

Файл: test_tokenizer.py Проект: yyht/sciwing

 def test_len_sample_batch(self):
     sample_sentences = ["I like big apple.", "We process text"]
     tokenizer = WordTokenizer()
     tokenized = tokenizer.tokenize_batch(sample_sentences)
     assert len(tokenized) == 2