Python Solr.post_iteratorの例

プログラミング言語: Python

名前空間/パッケージ名: solr

クラス/型: Solr

メソッド/関数: post_iterator

hotexamples.comのコード掲載数: 12

Python Solr.post_iterator - 12件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのsolr.Solr.post_iteratorの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Solr(30)

post_iterator(7)

commit(6)

add(5)

select(4)

query(3)

query_iterator(3)

docs(2)

numFound(2)

delete_by_id(1)

delete_many(1)

facet_fields(1)

delete(1)

optimize(1)

post(1)

add_many(1)

process(1)

loadConfig(1)

コード例 #1

ファイルを表示

def index_docs(docs, solr_url, corpus, buffer_size=2000):
    from solr import Solr
    solr = Solr(solr_url)
    docs = (seg for doc in docs for seg in doc.to_rec_dicts())

    def set_corpus(doc):
        doc['corpus'] = corpus
        return doc

    docs = map(set_corpus, docs)
    solr.post_iterator(docs, buffer_size=buffer_size)

コード例 #2

ファイルを表示

ファイル: csvindexer.py プロジェクト: USCDataScience/parser-indexer-py

 def index(self, docs, solr_url):
     solr = Solr(solr_url)
     success, count = solr.post_iterator(docs)
     if success:
         print("Indexed %d docs" % count)
     else:
         print("Error: Indexing failed, check solr logs")

コード例 #3

ファイルを表示

ファイル: csvindexer.py プロジェクト: farhadrclass/DataScience-Lab

 def index(self, docs, solr_url):
     solr = Solr(solr_url)
     success, count = solr.post_iterator(docs)
     if success:
         print("Indexed %d docs" % count)
     else:
         print("Error: Indexing failed, check solr logs")

コード例 #4

ファイルを表示

ファイル: ingest.py プロジェクト: jiaruiou/tika-similarity

def solrIngest(URL, dataset=None, inputDir=None, accept=None):

    solr = Solr(URL)
    documents = []

    if dataset:
        documents = lazyDataset(dataset)
    elif inputDir:
        documents = lazySolr(inputDir, accept)

    count, res = solr.post_iterator(documents, commit=True, buffer_size=100)

    print(("Res : %s; count=%d" % (res, count)))

コード例 #5

ファイルを表示

 def index(self, solr_url, in_file):
     '''
     Reads annotations at the specified path and indexes them to solr
     @param solr_url Target Solr URL to index
     @param in_file CSV file having text file and annotation file paths
     '''
     solr = Solr(solr_url)
     recs = self.read_records(in_file)
     count, success, = solr.post_iterator(recs)
     if success:
         print("Indexed %d docs" % count)
     else:
         print("Error: Failed. Check solr logs")

コード例 #6

ファイルを表示

ファイル: ingest.py プロジェクト: chrismattmann/tika-similarity

def solrIngest(URL, dataset=None, inputDir=None, accept=None):

    solr = Solr(URL)
    documents = []

    if dataset:
        documents = lazyDataset(dataset)
    elif inputDir:
        documents = lazySolr(inputDir, accept)

    count, res = solr.post_iterator(documents, commit=True, buffer_size=100)

    print("Res : %s; count=%d" % (res, count))

コード例 #7

ファイルを表示

ファイル: brat_ann_indexer.py プロジェクト: USCDataScience/parser-indexer-py

 def index(self, solr_url, in_file):
     '''
     Reads annotations at the specified path and indexes them to solr
     @param solr_url Target Solr URL to index
     @param in_file CSV file having text file and annotation file paths
     '''
     solr = Solr(solr_url)
     recs = self.read_records(in_file)
     count, success, = solr.post_iterator(recs)
     if success:
         print("Indexed %d docs" % count)
     else:
         print("Error: Failed. Check solr logs")

コード例 #8

ファイルを表示

                objects = []
                scores = []
                for obj, confd in row.items():
                    for o in obj.split(","):
                        objects.append(o.strip())
                        scores.append(confd)
            delta['objects'] = {'set' : objects}
            delta['confidence'] = {'set': scores}
            yield delta


if __name__ == '__main__':
    # Get the CSV file from classifier-local.py
    if len(sys.argv) != 2:
        print("required args:\n <CSV_file>")
        sys.exit(1)
    infile = sys.argv[1]
    min_confidence = 0.30
    print("Reading from %s, Min confidence=%f" % (infile, min_confidence))
    solr_url = "http://localhost:8983/solr/imagecatdev"
    solr = Solr(solr_url)

    updates = generate_solr_updates(infile, min_confidence=min_confidence)
    count, res = solr.post_iterator(updates, commit=True, buffer_size=1000)
    print("Res : %s; count=%d" %(res, count))
    '''
    from pprint import pprint
    for u in updates:
      pprint(u)
    '''

コード例 #9

ファイルを表示

ファイル: lastmodified_update.py プロジェクト: mganta/parser-indexer

            o.write("\n")
            count += 1
        return count

def read_stream(filename):
    '''
    Reads json line stream
    :param filename: path to json line
    :return: doc stream
    '''
    with open(filename) as inf:
        for l in inf:
            yield json.loads(l)

if __name__ == '__main__':
    url = "http://imagecat.dyndns.org:8983/solr/imagecatdev"
    filename = "docs.docs.jsonl"
    solr = Solr(url)
    docs = solr.query_iterator("lastModified:[1960-01-01T00:00:00Z TO 2005-12-31T00:00:00Z]",
                        rows=1000, fl='id')

    count = store_stream(docs, filename)
    print("Wrote %d docs to %s" % (count, filename))
    docs = read_stream(filename)
    updates = remove_last_modified(docs)

    count, success = solr.post_iterator(updates, False)
    print(success)
    print(count)

コード例 #10

ファイルを表示


def read_stream(filename):
    '''
    Reads json line stream
    :param filename: path to json line
    :return: doc stream
    '''
    with open(filename) as inf:
        for l in inf:
            yield json.loads(l)


if __name__ == '__main__':
    url = "http://imagecat.dyndns.org:8983/solr/imagecatdev"
    filename = "docs.docs.jsonl"
    solr = Solr(url)
    docs = solr.query_iterator(
        "lastModified:[1960-01-01T00:00:00Z TO 2005-12-31T00:00:00Z]",
        rows=1000,
        fl='id')

    count = store_stream(docs, filename)
    print("Wrote %d docs to %s" % (count, filename))
    docs = read_stream(filename)
    updates = remove_last_modified(docs)

    count, success = solr.post_iterator(updates, False)
    print(success)
    print(count)

コード例 #11

ファイルを表示

ファイル: phonenumbers.py プロジェクト: mganta/parser-indexer

            u['phonenumbers'] = {'set': d['ner_phone_number_ts_md']}
            u['ner_phone_number_ts_md'] = {'set': None}
        else:
            print("Error: Skipped")
            continue
        yield u


def read_stream(filename):
    '''
    Reads json line stream
    :param filename: path to json line
    :return: doc stream
    '''
    with open(filename) as inf:
        for l in inf:
            yield json.loads(l)

if __name__ == '__main__':
    url = "http://127.0.0.1:8983/solr/imagecatdev"
    solr = Solr(url)
    docs = solr.query_iterator("ner_phone_number_t_md:* OR ner_phone_number_ts_md:*",
                        rows=1000, fl='id,ner_phone_number_t_md,ner_phone_number_ts_md', sort="indexedAt asc")

    updates = fix_phonenumbers(docs)
    count, success = solr.post_iterator(updates, False, buffer_size=1000)
    solr.commit()
    print(success)
    print(count)

コード例 #12

ファイルを表示

ファイル: phonenumbers.py プロジェクト: asitang/parser-indexer

            print("Error: Skipped")
            continue
        yield u


def read_stream(filename):
    '''
    Reads json line stream
    :param filename: path to json line
    :return: doc stream
    '''
    with open(filename) as inf:
        for l in inf:
            yield json.loads(l)


if __name__ == '__main__':
    url = "http://127.0.0.1:8983/solr/imagecatdev"
    solr = Solr(url)
    docs = solr.query_iterator(
        "ner_phone_number_t_md:* OR ner_phone_number_ts_md:*",
        rows=1000,
        fl='id,ner_phone_number_t_md,ner_phone_number_ts_md',
        sort="indexedAt asc")

    updates = fix_phonenumbers(docs)
    count, success = solr.post_iterator(updates, False, buffer_size=1000)
    solr.commit()
    print(success)
    print(count)