Python InvertedIndex.append примеры использования

Язык программирования: Python

Пространство имен/Пакет: indexer

Класс/Тип: InvertedIndex

Метод/Функция: append

Примеров на hotexamples.com: 3

Python InvertedIndex.append - 3 примера найдено. Это лучшие примеры Python кода для indexer.InvertedIndex.append, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

InvertedIndex(8)

append(2)

enhanced_query(2)

getDict(2)

loadInvertedIndex(2)

merge(2)

query(2)

update(2)

write(2)

build(1)

calc_scores(1)

clear(1)

get_bottom_df_ids(1)

get_top_df_ids(1)

init_index(1)

Пример #1

Показать файл

def write(plist, url, title, config):
    '''
    RQ worker function which adds the given document posting list data to the
    inverted index.
    '''
    MAX_DOCS = int(config.get('crawler', 'max_docs'))
    TERM_DICT_FILE = config.get('indexer', 'term_dict_file')
    DOC_LIST_FILE = config.get('indexer', 'doc_list_file')

    dl = DocList(DOC_LIST_FILE)
    if len(dl) < MAX_DOCS:
        did = md5(url).hexdigest()

        if did not in dl:
            dl.append(url, title)

            iidx = InvertedIndex(TERM_DICT_FILE, DOC_LIST_FILE)
            iidx.append(plist, did)
            iidx.update()

Пример #2

Показать файл

Файл: worker.py Проект: wakewalker/eecs767

def write(plist, url, title, config):
    '''
    RQ worker function which adds the given document posting list data to the
    inverted index.
    '''
    MAX_DOCS = int(config.get('crawler', 'max_docs'))
    TERM_DICT_FILE = config.get('indexer', 'term_dict_file')
    DOC_LIST_FILE = config.get('indexer', 'doc_list_file')
    
    dl = DocList(DOC_LIST_FILE)
    if len(dl) < MAX_DOCS:
        did = md5(url).hexdigest()

        if did not in dl:
            dl.append(url, title)

            iidx = InvertedIndex(
                TERM_DICT_FILE,
                DOC_LIST_FILE
            )
            iidx.append(plist, did)
            iidx.update()

Пример #3

Показать файл

from tokenizer import DocProcessor
from indexer import InvertedIndex

docs = {
    1: '/home/ubuntu/eecs767/var/docs/doc1.html',
    2: '/home/ubuntu/eecs767/var/docs/doc2.html',
    3: '/home/ubuntu/eecs767/var/docs/doc3.html',
    4: '/home/ubuntu/eecs767/var/docs/doc4.html',
    5: '/home/ubuntu/eecs767/var/docs/doc5.html',
}

dproc = DocProcessor()
iidx = InvertedIndex()

for did, doc in docs.iteritems():
    print '-- Processing Doc #%s: %s' % (did, doc)
    dproc.parse(doc)
    plist = dproc.gen_posting_list()

    iidx.append(plist, did)
    iidx.update()
    iidx.clear()