Python get_date_intervalの例

プログラミング言語: Python

名前空間/パッケージ名: pipeline.helpers.util

メソッド/関数: get_date_interval

hotexamples.comのコード掲載数: 3

Python get_date_interval - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのpipeline.helpers.util.get_date_intervalの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: spark_apps.py プロジェクト: TylerJFisher/ooni-pipeline

def run(date_interval, src="s3n://ooni-public/reports-sanitised/streams/",
        dst="s3n://ooni-public/processed/",
        imported_dir="s3n://ooni-public/reports-sanitised/yaml/",
        worker_processes=16):

    sch = luigi.scheduler.CentralPlannerScheduler()
    w = luigi.worker.Worker(
        scheduler=sch, worker_processes=worker_processes)

    imported_dates = get_imported_dates(
        imported_dir, aws_access_key_id=config.aws.access_key_id,
        aws_secret_access_key=config.aws.secret_access_key)

    interval = get_date_interval(date_interval)
    for date in interval:
        if str(date) not in imported_dates:
            continue

        logger.info("Running CountInterestingReports for %s on %s to %s" %
                    (date, src, dst))
        task = SparkResultsToDatabase(src=src, date=date, dst=dst)
        w.add(task)

    w.run()
    w.stop()

コード例 #2

ファイルを表示

ファイル: sanitise.py プロジェクト: TylerJFisher/ooni-pipeline

def run(src, dst_private, dst_public, date_interval, worker_processes=16):

    sch = luigi.scheduler.CentralPlannerScheduler()
    w = luigi.worker.Worker(scheduler=sch,
                            worker_processes=worker_processes)

    interval = get_date_interval(date_interval)
    for date in interval:
        logger.debug("working on %s" % date)
        task = AggregateYAMLReports(dst_private=dst_private,
                                    dst_public=dst_public, src=src, date=date)
        w.add(task)
    w.run()
    w.stop()

コード例 #3

ファイルを表示

ファイル: add_headers_to_db.py プロジェクト: TylerJFisher/ooni-pipeline

def run(src, dst_private, dst_public, date_interval, worker_processes=16):
    sch = luigi.scheduler.CentralPlannerScheduler()
    w = luigi.worker.Worker(scheduler=sch,
                            worker_processes=worker_processes)

    imported_dates = get_imported_dates(src,
                                        aws_access_key_id=config.aws.access_key_id,
                                        aws_secret_access_key=config.aws.secret_access_key)
    interval = get_date_interval(date_interval)
    for date in interval:
        if str(date) not in imported_dates:
            continue
        logging.info("adding headers for date: %s" % date)
        task = ReportHeadersToDatabase(dst_private=dst_private,
                                       dst_public=dst_public,
                                       src=src, date=date)
        w.add(task)
    w.run()
    w.stop()