Python average_by_keyの例

プログラミング言語: Python

名前空間/パッケージ名: spark_utils

メソッド/関数: average_by_key

hotexamples.comのコード掲載数: 5

Python average_by_key - 5件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのspark_utils.average_by_keyの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: agents_count.py プロジェクト: erlang-mas/emas-plotter

def aggregate(rdd, op=None):
    rdd = rdd.reduceByKey(op) if op else average_by_key(rdd)
    rdd = rdd.map(lambda ((_experiment, second), value): (second, value))
    rdd = average_by_key(rdd)
    rdd = rdd.map(lambda (second, value): (second, int(value)))
    rdd = rdd.sortByKey()
    data = rdd.collect()
    return zip(*data)

コード例 #2

ファイルを表示

ファイル: energy.py プロジェクト: erlang-mas/emas-plotter

def process(sc, series_dir):
    log_paths = fetch_log_paths(series_dir)
    rdd = sc.parallelize(log_paths)
    rdd = rdd.flatMap(parse_log_file)
    rdd = average_by_key(rdd)
    rdd = rdd.map(lambda ((_experiment, measurement), value): (measurement, value))
    rdd = average_by_key(rdd)
    rdd = rdd.sortByKey()
    return zip(*rdd.collect())

コード例 #3

ファイルを表示

def aggregate(rdd):
    rdd = rdd.filter(lambda (_key, value): value > -10000)
    rdd = rdd.reduceByKey(min)
    rdd = rdd.map(lambda ((_experiment, second), value): (second, value))
    rdd = average_by_key(rdd)
    rdd = rdd.map(lambda (second, value): (second, value))
    rdd = rdd.sortByKey()
    data = rdd.collect()
    return zip(*data)

コード例 #4

ファイルを表示

ファイル: empty_populations.py プロジェクト: erlang-mas/emas-plotter

def aggregate(rdd):
    rdd = rdd.map(lambda (key, value): (key, 1) if value < 10 else (key, 0))
    rdd = rdd.reduceByKey(add)
    rdd = rdd.map(lambda ((_experiment, second), value): (second, value))
    rdd = average_by_key(rdd)
    rdd = rdd.map(lambda (second, value): (second, int(value)))
    rdd = rdd.sortByKey()
    data = rdd.collect()
    return zip(*data)

コード例 #5

ファイルを表示

ファイル: reproductions.py プロジェクト: erlang-mas/emas-plotter

def process(sc, logs_dir):
    log_paths = fetch_log_paths(logs_dir)
    rdd = sc.parallelize(log_paths)
    rdd = rdd.flatMap(parse_log_file)
    rdd = rdd.filter(lambda ((_nodes_count, _experiment, measurement), _value):
                     50 < measurement < 250)
    rdd = rdd.map(lambda ((nodes_count, experiment, _measurement), value):
                  ((nodes_count, experiment), value))
    rdd = rdd.reduceByKey(add)
    rdd = rdd.map(lambda ((nodes_count, _experiment), value):
                  (nodes_count, value / 200))
    rdd = average_by_key(rdd)
    rdd = rdd.sortByKey()
    return zip(*rdd.collect())