Python SimpleTokenizer примеры использования

Язык программирования: Python

Пространство имен/Пакет: pubmed_tokenize

Класс/Тип: SimpleTokenizer

Примеров на hotexamples.com: 2

Python SimpleTokenizer - 2 примера найдено. Это лучшие примеры Python кода для pubmed_tokenize.SimpleTokenizer, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

SimpleTokenizer(1)

tokenize(1)

Пример #1

Показать файл

class SentenceStream(object):
    def __init__(self):
        self.docs = CaseReportLibrary()
        self.tokenizer = SimpleTokenizer()

    def __iter__(self):
        doc_count = len(self.docs)
        count = 0
        for doc in self.docs:
            for sentence in sent_tokenize(doc.get_text().lower()):
                tokens = self.tokenizer.tokenize(sentence)
                yield tokens
            count += 1
            logging.info(msg="%s/%s documents streamed" % (count, doc_count, ))

Пример #2

Показать файл

 def __init__(self):
     self.docs = CaseReportLibrary()
     self.tokenizer = SimpleTokenizer()