Ejemplos de J.A_IndexCollection en Python

Lenguaje de programación: Python

Namespace/Package Name: onir.interfaces.java

Clase / Tipo: J

Método / Función: A_IndexCollection

Ejemplos en hotexamples.com: 2

Python J.A_IndexCollection - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de onir.interfaces.java.J.A_IndexCollection extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

L_Term(3)

L_CharArraySet(3)

A_IndexCollection(2)

M_CmdLineParser(2)

A_SearchArgs(2)

A_SearchCollection(2)

L_QueryParser(2)

A_IndexArgs(2)

L_LMDirichletSimilarity(1)

L_StandardAnalyzer(1)

A_EnglishStemmingAnalyzer(1)

L_IndexSearcher(1)

L_ClassicSimilarity(1)

L_BM25Similarity(1)

File(1)

A_SimpleSearcher(1)

A_IndexUtils(1)

initialize(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: anserini.py Proyecto: bpiwowar/OpenNIR-xpm

 def build_jsoup(self, path, replace=False, optimize=True):
     with logger.duration(f'building {self._path}'):
         if self._settings['built']:
             if replace:
                 logger.warn(f'removing index: {self._path}')
                 shutil.rmtree(self._path)
             else:
                 logger.warn(f'adding to existing index: {self._path}')
         thread_count = onir.util.safe_thread_count()
         index_args = J.A_IndexArgs()
         index_args.collectionClass = 'TrecCollection'
         index_args.generatorClass = 'JsoupGenerator'
         index_args.threads = thread_count
         index_args.input = path
         index_args.index = self._path
         index_args.storePositions = True
         index_args.storeDocvectors = True
         index_args.storeRawDocs = True
         index_args.storeTransformedDocs = True
         index_args.keepStopwords = self._settings['keep_stops']
         index_args.stemmer = self._settings['stemmer']
         index_args.optimize = optimize
         indexer = J.A_IndexCollection(index_args)
         thread = threading.Thread(target=indexer.run)
         thread.start()
         thread.join()
         self._settings['built'] = True
         self._dump_settings()

Ejemplo n.º 2

Mostrar archivo

Archivo: multifield_anserini.py Proyecto: tgeral68/OpenNIR

 def build(self,
           doc_iter,
           replace=False,
           optimize=True,
           store_term_weights=False):
     with logger.duration(f'building {self._base_path}'):
         thread_count = onir.util.safe_thread_count()
         with tempfile.TemporaryDirectory() as d:
             if self._settings['built']:
                 if replace:
                     logger.warn(f'removing index: {self._base_path}')
                     shutil.rmtree(self._base_path)
                 else:
                     logger.warn(
                         f'adding to existing index: {self._base_path}')
             fifos = []
             for t in range(thread_count):
                 fifo = os.path.join(d, f'{t}.json')
                 os.mkfifo(fifo)
                 fifos.append(fifo)
             index_args = J.A_IndexArgs()
             index_args.collectionClass = 'JsonCollection'
             index_args.generatorClass = 'LuceneDocumentGenerator'
             index_args.threads = thread_count
             index_args.input = d
             index_args.index = self._base_path
             index_args.storePositions = True
             index_args.storeDocvectors = True
             index_args.storeTermWeights = store_term_weights
             index_args.keepStopwords = self._settings['keep_stops']
             index_args.stemmer = self._settings['stemmer']
             index_args.optimize = optimize
             indexer = J.A_IndexCollection(index_args)
             thread = threading.Thread(target=indexer.run)
             thread.start()
             time.sleep(
                 1
             )  # give it some time to start up, otherwise fails due to race condition
             for i, doc in enumerate(doc_iter):
                 f = fifos[hash(i) % thread_count]
                 if isinstance(f, str):
                     f = open(f, 'wt')
                     fifos[hash(i) % thread_count] = f
                 data = {'id': doc.did, 'contents': 'a'}
                 data.update(doc.data)
                 json.dump(data, f)
                 f.write('\n')
             for f in fifos:
                 if not isinstance(f, str):
                     f.close()
                 else:
                     with open(f, 'wt'):
                         pass  # open and close to indicate file is done
             logger.debug('waiting to join')
             thread.join()
             self._settings['built'] = True
             self._dump_settings()