Python AlephAPI.ingest_upload Exemples

Langage de programmation: Python

Espace de nommage/Pack: alephclient.api

Class/Type: AlephAPI

Méthode/Fonction: ingest_upload

Exemples au hotexamples.com: 2

Python AlephAPI.ingest_upload - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de alephclient.api.AlephAPI.ingest_upload extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

AlephAPI(13)

load_collection_by_foreign_id(5)

_make_url(2)

get_collection_by_foreign_id(2)

ingest_upload(2)

_request(1)

filter_collections(1)

get_collection(1)

get_entity(1)

Méthodes fréquemment utilisées

AlephAPI (13)

load_collection_by_foreign_id (5)

_make_url (2)

get_collection_by_foreign_id (2)

ingest_upload (2)

_request (1)

filter_collections (1)

get_collection (1)

get_entity (1)

Exemple #1

0

Afficher le fichier

Fichier : crawldir.py Projet : mynameisfiber/alephclient

def _upload_path(api: AlephAPI, path: Path, collection_id: str, parent_id: str, foreign_id: str) -> str: metadata = { 'foreign_id': foreign_id, 'file_name': path.name, } log.info('Upload [%s->%s]: %s', collection_id, parent_id, foreign_id) if parent_id is not None: metadata['parent_id'] = parent_id result = api.ingest_upload(collection_id, path, metadata=metadata) if 'id' not in result: raise AlephException('Upload failed') return result['id']

Exemple #2

0

Afficher le fichier

Fichier : aleph.py Projet : edmondsylar/memorious

def aleph_emit(context, data): if not settings.ALEPH_HOST: context.log.warning("No $MEMORIOUS_ALEPH_HOST, skipping upload...") return if not settings.ALEPH_API_KEY: context.log.warning("No $MEMORIOUS_ALEPH_API_KEY, skipping upload...") return session_id = 'memorious:%s' % context.crawler.name api = AlephAPI(settings.ALEPH_HOST, settings.ALEPH_API_KEY, session_id=session_id) collection_id = get_collection_id(context, api) if collection_id is None: context.log.warning("Cannot get aleph collection.") return content_hash = data.get('content_hash') source_url = data.get('source_url', data.get('url')) foreign_id = data.get('foreign_id', data.get('request_id', source_url)) if context.skip_incremental(collection_id, foreign_id, content_hash): context.log.info("Skip aleph upload: %s", foreign_id) return meta = { 'crawler': context.crawler.name, 'foreign_id': foreign_id, 'source_url': source_url, 'title': data.get('title'), 'author': data.get('author'), 'file_name': data.get('file_name'), 'retrieved_at': data.get('retrieved_at'), 'modified_at': data.get('modified_at'), 'published_at': data.get('published_at'), 'headers': data.get('headers', {}) } languages = context.params.get('languages') meta['languages'] = data.get('languages', languages) countries = context.params.get('countries') meta['countries'] = data.get('countries', countries) mime_type = context.params.get('mime_type') meta['mime_type'] = data.get('mime_type', mime_type) if data.get('parent_foreign_id'): meta['parent'] = {'foreign_id': data.get('parent_foreign_id')} meta = clean_dict(meta) # pprint(meta) label = meta.get('file_name', meta.get('source_url')) context.log.info("Upload: %s", label) with context.load_file(content_hash) as fh: if fh is None: return file_path = Path(fh.name).resolve() res = api.ingest_upload(collection_id, file_path, meta) if res.get('status') == 'ok': document = res.get('documents')[0] context.log.info("Document ID: %s", document['id']) else: context.emit_warning("Error: %r" % res)