Python get_imported_dates Exemples

Langage de programmation: Python

Espace de nommage/Pack: pipeline.helpers.util

Méthode/Fonction: get_imported_dates

Exemples au hotexamples.com: 2

Python get_imported_dates - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de pipeline.helpers.util.get_imported_dates extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Associées

PlaceResolver

setMultiSample

get_series

UberClient

get_zipped_data

Region

cstring

Quest

apply_matrix_norm

Fixed

Related in langs

Cookie (PHP)

TextBlockTranslation (PHP)

Button (C#)

HelpPageApiModel (C#)

settingsRequest (C++)

Init_libMPSSE (C++)

ValidateEndpoint (Go)

Done (Go)

ClientIndex (Java)

FilePatch (Java)

Exemple #1

0

Afficher le fichier

Fichier : spark_apps.py Projet : TylerJFisher/ooni-pipeline

def run(date_interval, src="s3n://ooni-public/reports-sanitised/streams/", dst="s3n://ooni-public/processed/", imported_dir="s3n://ooni-public/reports-sanitised/yaml/", worker_processes=16): sch = luigi.scheduler.CentralPlannerScheduler() w = luigi.worker.Worker( scheduler=sch, worker_processes=worker_processes) imported_dates = get_imported_dates( imported_dir, aws_access_key_id=config.aws.access_key_id, aws_secret_access_key=config.aws.secret_access_key) interval = get_date_interval(date_interval) for date in interval: if str(date) not in imported_dates: continue logger.info("Running CountInterestingReports for %s on %s to %s" % (date, src, dst)) task = SparkResultsToDatabase(src=src, date=date, dst=dst) w.add(task) w.run() w.stop()

Exemple #2

0

Afficher le fichier

Fichier : add_headers_to_db.py Projet : TylerJFisher/ooni-pipeline

def run(src, dst_private, dst_public, date_interval, worker_processes=16): sch = luigi.scheduler.CentralPlannerScheduler() w = luigi.worker.Worker(scheduler=sch, worker_processes=worker_processes) imported_dates = get_imported_dates(src, aws_access_key_id=config.aws.access_key_id, aws_secret_access_key=config.aws.secret_access_key) interval = get_date_interval(date_interval) for date in interval: if str(date) not in imported_dates: continue logging.info("adding headers for date: %s" % date) task = ReportHeadersToDatabase(dst_private=dst_private, dst_public=dst_public, src=src, date=date) w.add(task) w.run() w.stop()