Python IndexSearcher.close примеры использования

Язык программирования: Python

Пространство имен/Пакет: org.apache.lucene.search

Класс/Тип: IndexSearcher

Метод/Функция: close

Примеров на hotexamples.com: 3

Python IndexSearcher.close - 3 примера найдено. Это лучшие примеры Python кода для org.apache.lucene.search.IndexSearcher.close, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

IndexSearcher(30)

doc(30)

search(30)

setSimilarity(30)

explain(12)

getIndexReader(5)

getSimilarity(4)

close(2)

count(1)

getTopReaderContext(1)

get_description(1)

searchAfter(1)

Пример #1

Показать файл

Файл: search.py Проект: optivo-org/informa-0.7.0-optivo

from org.apache.lucene.analysis.standard import StandardAnalyzer
from org.apache.lucene.search import IndexSearcher
from org.apache.lucene.queryParser import QueryParser

searcher = IndexSearcher("index")
analyzer = StandardAnalyzer()

if len(sys.argv) < 2:
    print "Usage: %s query" % sys.argv[0]
    sys.exit(0)

q_str = sys.argv[1]
print "\nSearching for <%s>." % q_str

query = QueryParser.parse(q_str, "titledesc", analyzer)
print "query:", query
hits = searcher.search(query)

print "%d total matching item(s).\n" % hits.length()

for i in xrange(hits.length()):
    doc = hits.doc(i)
    score = hits.score(i)
    print "- [Id: %s] Score %.4f" % (doc.get("id"), score)
    print "  Title: %s" % doc.get("title")
    print "  Description: %s" % doc.get("description")
    print

searcher.close()
print

Пример #2

Показать файл

Файл: search.py Проект: fazonbence/java-corpus

from org.apache.lucene.analysis.standard import StandardAnalyzer
from org.apache.lucene.search import IndexSearcher
from org.apache.lucene.queryParser import QueryParser

searcher = IndexSearcher("index")
analyzer = StandardAnalyzer()

if len(sys.argv) < 2:
    print "Usage: %s query" % sys.argv[0]
    sys.exit(0)

q_str = sys.argv[1]
print "\nSearching for <%s>." % q_str

query = QueryParser.parse(q_str, "titledesc", analyzer)
print "query:", query
hits = searcher.search(query)

print "%d total matching item(s).\n" % hits.length()

for i in xrange(hits.length()):
    doc = hits.doc(i)
    score = hits.score(i)
    print "- [Id: %s] Score %.4f" % (doc.get("id"), score)
    print "  Title: %s" % doc.get("title")
    print "  Description: %s" % doc.get("description")
    print

searcher.close()
print

Пример #3

Показать файл

Файл: Searcher.py Проект: cathyzhang7066/search-engine

class ArticleSearcher(object):
    def __init__(self, store_dir):
        initVM()
        directory = SimpleFSDirectory(File(store_dir))
        self.searcher = IndexSearcher(DirectoryReader.open(directory))
        print 'loaded index: %s' % store_dir
        self.analyzer = {}
        self.analyzer['StandardAnalyzer'] = StandardAnalyzer(Version.LUCENE_CURRENT)
        self.analyzer['SimpleAnalyzer'] = SimpleAnalyzer(Version.LUCENE_CURRENT)
        self.analyzer['ChineseAnalyzer'] = ChineseAnalyzer(Version.LUCENE_CURRENT)

    def _set_store_dir(self, store_dir):
        self.searcher.close()
        directory = SimpleFSDirectory(File(store_dir))
        self.searcher = IndexSearcher(directory, True)
        print 'loaded index: %s' % store_dir

    def close(self):
        self.searcher.close()

    def search_by(self, **kwargs):
        command = kwargs.get('command', '')
        if command == '':
            return None
        field = kwargs.get('field')
        query_type = kwargs.get('query_type', 'chi')
        if query_type == 'chi':
            if field in ['token_taglist', 'token_content', 'token_title', 'token_author']:
                command = ' '.join(jieba.cut_for_search(command))
            hlt_analyzer = self.analyzer['ChineseAnalyzer']
        else:
            if field in ['token_content', 'token_title']:
                command = ' '.join(map(stem, command.split()))
            hlt_analyzer = self.analyzer['StandardAnalyzer']
        analyzer = self.analyzer['SimpleAnalyzer']
        num = kwargs.get('num', 50)
        attrs = kwargs.get('attrs', ['url', 'title'])
        print "[%s]\tSearching for '%s' in field '%s'" % (query_type, command, field)
        query = QueryParser(Version.LUCENE_CURRENT, field, analyzer).parse(command)
        if field in ['token_content', 'token_title']:
            getAbs = True
            query_for_highlight = QueryParser(Version.LUCENE_CURRENT, 'content', hlt_analyzer).parse(command)
            scorer = QueryScorer(query_for_highlight)
            formatter = SimpleHTMLFormatter("<strong>", "</strong>")
            # formatter = SimpleHTMLFormatter("<span class=\"highlight\">", "</span>")
            highlighter = Highlighter(formatter, scorer)
            fragmenter = SimpleFragmenter(20)
            highlighter.setTextFragmenter(fragmenter)
        else:
            getAbs = False
        scoreDocs = self.searcher.search(query, num).scoreDocs
        print "%s total matching documents." % len(scoreDocs)
        articles = []
        for scoreDoc in scoreDocs:
            doc = self.searcher.doc(scoreDoc.doc)
            article = {}
            for attr in attrs:
                article[attr] = doc.get(attr)
            if getAbs is True:
                content = doc.get('content')
                tokenStream = hlt_analyzer.tokenStream("content", StringReader(content))
                article['abstract'] = highlighter.getBestFragments(tokenStream, content, 3, "...")
            articles.append(article)
        return articles