Python read_triplet_file примеры использования

Язык программирования: Python

Пространство имен/Пакет: preprocessing.readingfiles

Метод/Функция: read_triplet_file

Примеров на hotexamples.com: 4

Python read_triplet_file - 4 примера найдено. Это лучшие примеры Python кода для preprocessing.readingfiles.read_triplet_file, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Пример #1

Показать файл

Файл: topic_clustering_sw_process.py Проект: RedHenLab/CDI

def main():
    logging.basicConfig(level=logging.DEBUG)
    input_triplet_files = glob.glob('data/transformed_triplet_files_080819-081015/2008*.txt')
    input_triplet_files.sort()
    logging.debug('Files {0}'.format(len(input_triplet_files)))

    # Read in the triplets files, including the triplets and the time of the story
    original_documents = []
    for triplet_file in input_triplet_files:
        doc_tmp = readingfiles.read_triplet_file(triplet_file, use_ocr=True)
        if doc_tmp.filename != '' and doc_tmp.timestamp != '':
            original_documents.append(doc_tmp)
    logging.debug('Effective Files {0}'.format(len(original_documents)))

    # Train topic model
    model = topic_model.TopicModel(classifier_model_filename='preprocessing/model_segmenter.txt')
    model.feed(original_documents)

Пример #2

Показать файл

def main():
    logging.basicConfig(level=logging.DEBUG)
    input_triplet_files = glob.glob(
        'data/transformed_triplet_files_080819-081015/2008*.txt')
    input_triplet_files.sort()
    logging.debug('Files {0}'.format(len(input_triplet_files)))

    # Read in the triplets files, including the triplets and the time of the story
    original_documents = []
    for triplet_file in input_triplet_files:
        doc_tmp = readingfiles.read_triplet_file(triplet_file, use_ocr=True)
        if doc_tmp.filename != '' and doc_tmp.timestamp != '':
            original_documents.append(doc_tmp)
    logging.debug('Effective Files {0}'.format(len(original_documents)))

    # Train topic model
    model = topic_model.TopicModel(
        classifier_model_filename='preprocessing/model_segmenter.txt')
    model.feed(original_documents)

Пример #3

Показать файл

Файл: classifier.py Проект: RedHenLab/CDI

 def train_from_files(self, input_triplet_files, category_list):
     corpus = topic_model._Corpus()
     for triplet_file in input_triplet_files:
         corpus.add_document(readingfiles.read_triplet_file(triplet_file, use_ocr=True))
     self.train_from_corpus(corpus, category_list)

Пример #4

Показать файл

Файл: classifier.py Проект: roshniRam/CDI

 def train_from_files(self, input_triplet_files, category_list):
     corpus = topic_model._Corpus()
     for triplet_file in input_triplet_files:
         corpus.add_document(
             readingfiles.read_triplet_file(triplet_file, use_ocr=True))
     self.train_from_corpus(corpus, category_list)