Python IndexWriter.optimize 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: org.apache.lucene.index

클래스/타입: IndexWriter

메소드/함수: optimize

hotexamples.com에서의 예제들: 9

Python IndexWriter.optimize - 9개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 org.apache.lucene.index.IndexWriter.optimize에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

IndexWriter(30)

close(30)

commit(30)

addDocument(30)

numDocs(28)

deleteDocuments(11)

updateDocument(5)

optimize(5)

deleteAll(3)

rollback(2)

forceMerge(2)

setUseCompoundFile(2)

getReader(2)

getDocStats(1)

setMaxFieldLength(1)

getConfig(1)

docCount(1)

writerow(1)

예제 #1

파일 보기

파일: engine_withlucene.py 프로젝트: pdwaggoner/txtorg

 def reindex(self):
     writer = IndexWriter(SimpleFSDirectory(File(self.corpus.path)), self.corpus.analyzer, False, IndexWriter.MaxFieldLength.LIMITED)
     indexutils.reindex_all(self.reader, writer, self.corpus.analyzer)
     writer.optimize()
     writer.close()
     self.parent.write({'message': "Reindex successful. Corpus analyzer is now set to %s." % (self.corpus.analyzer_str,)})
     self.parent.write({'status': "Ready!"})

예제 #2

파일 보기

파일: lucenedriver.py 프로젝트: bradleyjones/apiary

    def removeindex(self, data):
        writer = IndexWriter(
            self.d, self.conf)

        writer.deleteDocuments(lucene.Term("_id", data['record']['_id']))

        writer.optimize()
        writer.close()

예제 #3

파일 보기

파일: lucenedriver.py 프로젝트: bradleyjones/apiary

    def updateindex(self, data):
        writer = IndexWriter(
            self.d, self.conf)

        doc = self.buildDocument(data['fields'], data['record'])
        writer.updateDocument(lucene.Term("_id", data['record']['_id']), doc)

        writer.optimize()
        writer.close()

예제 #4

파일 보기

    def index(self):
        if not (os.path.exists(self._dataDir)
                and os.path.isdir(self._dataDir)):
            raise IOError, "%s isn't existed or is not a directory" % (
                self._dataDir)

        dir = SimpleFSDirectory(Paths.get(self._indexDir))
        writer = IndexWriter(dir, StandardAnalyzer(), True,
                             IndexWriter.MaxFieldLength.LIMITED)
        writer.setUseCompoundFile(False)
        self.indexDirectory(writer, self._dataDir)
        numIndexed = writer.numDocs()
        writer.optimize()
        writer.close()
        dir.close()

        return numIndexed

예제 #5

파일 보기

파일: indexserver.py 프로젝트: Zojax/zojax.lucene

    def xmlrpc_indexDocument(self, instance, id, text):
        """Index a new document."""
        self.xmlrpc_unindexDocument(instance, id)

        # Create a document and add two fields to it. 
        doc = Document()
        doc.add(Field('id', id, Field.Store.YES, Field.Index.UN_TOKENIZED))
        doc.add(Field('text', text, Field.Store.YES, Field.Index.TOKENIZED))
        doc.add(Field('instance', instance, Field.Store.YES, Field.Index.UN_TOKENIZED))

        # Write the document into the index.
        writer = IndexWriter(self.indexPath, self.analyzer, 0)
        writer.addDocument(doc)
        writer.optimize()
        writer.close()
        log('Insert: Instance: %s Document: %s' %(instance, id))
        return 1

예제 #6

파일 보기

파일: engine_withlucene.py 프로젝트: pdwaggoner/txtorg

    def _init_index(self):

        if not os.path.exists(self.corpus.path):
            os.mkdir(self.corpus.path)
        try:
            searcher = IndexSearcher(SimpleFSDirectory(File(self.corpus.path)), True)
        #except lucene.JavaError:
        except:
            analyzer = self.corpus.analyzer
            writer = IndexWriter(SimpleFSDirectory(File(self.corpus.path)), analyzer, True, IndexWriter.MaxFieldLength.LIMITED)
            writer.setMaxFieldLength(1048576)
            writer.optimize()
            writer.close()

        self.lucene_index = SimpleFSDirectory(File(self.corpus.path))
        self.searcher = IndexSearcher(self.lucene_index, True)
        self.reader = IndexReader.open(self.lucene_index, True)
        self.analyzer = self.corpus.analyzer

예제 #7

파일 보기

파일: Indexer.py 프로젝트: falloutphil/Misc

class FileIndexer:

    __fileList = []

    def __init__(self, dataDir, fileExtension, indexDir):
        os.path.walk(dataDir, self.__fileSearcher, fileExtension)
        self.__writer = IndexWriter(indexDir, StandardAnalyzer(), True)
        self.__writer.setUseCompoundFile(False)

    def __fileSearcher(self, fileExtension, dirname, filenames):
        #print "Directory:", dirname
        for filename in filenames:
            if filename.split('.')[-1] == fileExtension:
                self.__fileList.append(os.path.join(dirname, filename))

    def getNames(self):
        return self.__fileList

    def indexFiles(self):
        for filename in self.__fileList:
            print filename
            print File(filename).getCanonicalPath()
            doc = Document()
            doc.add(
                Field("contents",
                      open(filename, 'r').read(), Field.Store.YES,
                      Field.Index.TOKENIZED))
            doc.add(
                Field("path",
                      File(filename).getCanonicalPath(), Field.Store.YES,
                      Field.Index.UN_TOKENIZED))
            self.__writer.addDocument(doc)

    def optimizeAndClose(self):
        docCount = self.__writer.docCount()
        self.__writer.optimize()
        self.__writer.close()
        return docCount

예제 #8

파일 보기

# update an existing index (adding a new document).

from java.net import URL
from java.util import Date

# from de.nava.informa.impl.basic import ChannelBuilder
# from de.nava.informa.utils import ChannelRegistry
from de.nava.informa.impl.basic import Item
from de.nava.informa.search import ItemDocument

from org.apache.lucene.analysis.standard import StandardAnalyzer
from org.apache.lucene.index import IndexWriter

# update (3rd arg) index writer in directory (first arg)
start_time = Date()
writer = IndexWriter("index", StandardAnalyzer(), 0)

# create new (dummy) item
item = Item("Informa released", "blubb", URL("http://nava.de/news/2002/06/25"))
item.setFound(Date())

# add new item to index
writer.addDocument(ItemDocument.makeDocument(item))

writer.optimize()
writer.close()
end_time = Date()

print "updating the index took %d milliseconds in total." \
      % (end_time.getTime() - start_time.getTime())

예제 #9

파일 보기

파일: update-index.py 프로젝트: optivo-org/informa-0.7.0-optivo

from java.net import URL
from java.util import Date

# from de.nava.informa.impl.basic import ChannelBuilder
# from de.nava.informa.utils import ChannelRegistry
from de.nava.informa.impl.basic import Item
from de.nava.informa.search import ItemDocument

from org.apache.lucene.analysis.standard import StandardAnalyzer
from org.apache.lucene.index import IndexWriter


# update (3rd arg) index writer in directory (first arg)
start_time = Date()
writer = IndexWriter("index", StandardAnalyzer(), 0)

# create new (dummy) item
item = Item("Informa released", "blubb",
            URL("http://nava.de/news/2002/06/25"))
item.setFound(Date())
	    
# add new item to index
writer.addDocument(ItemDocument.makeDocument(item))

writer.optimize()
writer.close()
end_time = Date()

print "updating the index took %d milliseconds in total." \
      % (end_time.getTime() - start_time.getTime())