Python InvertedIndex.update Exemples

Langage de programmation: Python

Espace de nommage/Pack: indexer

Class/Type: InvertedIndex

Méthode/Fonction: update

Exemples au hotexamples.com: 3

Python InvertedIndex.update - 3 exemples trouvés. Ce sont les exemples réels les mieux notés de indexer.InvertedIndex.update extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

InvertedIndex(8)

append(2)

enhanced_query(2)

getDict(2)

loadInvertedIndex(2)

merge(2)

query(2)

update(2)

write(2)

build(1)

calc_scores(1)

clear(1)

get_bottom_df_ids(1)

get_top_df_ids(1)

init_index(1)

Méthodes fréquemment utilisées

InvertedIndex (8)

append (2)

enhanced_query (2)

getDict (2)

loadInvertedIndex (2)

merge (2)

query (2)

update (2)

write (2)

build (1)

Méthodes fréquemment utilisées

calc_scores (1)

clear (1)

get_bottom_df_ids (1)

get_top_df_ids (1)

init_index (1)

Exemple #1

0

Afficher le fichier

def write(plist, url, title, config): ''' RQ worker function which adds the given document posting list data to the inverted index. ''' MAX_DOCS = int(config.get('crawler', 'max_docs')) TERM_DICT_FILE = config.get('indexer', 'term_dict_file') DOC_LIST_FILE = config.get('indexer', 'doc_list_file') dl = DocList(DOC_LIST_FILE) if len(dl) < MAX_DOCS: did = md5(url).hexdigest() if did not in dl: dl.append(url, title) iidx = InvertedIndex(TERM_DICT_FILE, DOC_LIST_FILE) iidx.append(plist, did) iidx.update()

Exemple #2

0

Afficher le fichier

Fichier : worker.py Projet : wakewalker/eecs767

def write(plist, url, title, config): ''' RQ worker function which adds the given document posting list data to the inverted index. ''' MAX_DOCS = int(config.get('crawler', 'max_docs')) TERM_DICT_FILE = config.get('indexer', 'term_dict_file') DOC_LIST_FILE = config.get('indexer', 'doc_list_file') dl = DocList(DOC_LIST_FILE) if len(dl) < MAX_DOCS: did = md5(url).hexdigest() if did not in dl: dl.append(url, title) iidx = InvertedIndex( TERM_DICT_FILE, DOC_LIST_FILE ) iidx.append(plist, did) iidx.update()

Exemple #3

0

Afficher le fichier

from tokenizer import DocProcessor from indexer import InvertedIndex docs = { 1: '/home/ubuntu/eecs767/var/docs/doc1.html', 2: '/home/ubuntu/eecs767/var/docs/doc2.html', 3: '/home/ubuntu/eecs767/var/docs/doc3.html', 4: '/home/ubuntu/eecs767/var/docs/doc4.html', 5: '/home/ubuntu/eecs767/var/docs/doc5.html', } dproc = DocProcessor() iidx = InvertedIndex() for did, doc in docs.iteritems(): print '-- Processing Doc #%s: %s' % (did, doc) dproc.parse(doc) plist = dproc.gen_posting_list() iidx.append(plist, did) iidx.update() iidx.clear()