Python Spark_Sessionの例

プログラミング言語: Python

名前空間/パッケージ名: Pycrypto

クラス/型: Spark_Session

hotexamples.comのコード掲載数: 2

Python Spark_Session - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのPycrypto.Spark_Sessionの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Spark_Context(2)

Spark_Connect(1)

Spark_Session(1)

コード例 #1

ファイルを表示

def convert_to_line(json_list):
    json_string = ""
    for line in json_list:
        json_string += json.dumps(line) + "\n"
        print(json_string)
    return json_string


def parse_json(json_data, sc):
    r = convert_to_line(json_data)
    mylist = []
    for line in r.splitlines():
        mylist.append(line)
    rdd = sc.parallelize(mylist, 8)
    df = sqlContext.read.json(rdd)
    return df


if __name__ == '__main__':
    sprk = Spark_Session()
    conn = sprk.Spark_Context()
    sql_conn = sprk.Spark_Connect()
    sqlContext = SQLContext(conn)

##https://api.github.com/users?since=100
with urllib.request.urlopen("https://api.github.com/users?since=100") as url:
    data = parse_json(parse(url.read().decode("utf-8")), conn)

data.show()

コード例 #2

ファイルを表示

from pyspark import Row
from pyspark.streaming import StreamingContext
from pyspark.streaming.kafka import KafkaUtils
from pyspark.sql.context import SQLContext
import pandas as pd
import re
from pyspark.sql.functions import *
from operator import add
from Pycrypto import Spark_Session


def sum_cal(v):
    sum = 0.0
    for i in v:
        sum += i
    return sum


if __name__ == '__main__':
    sprk = Spark_Session()
    conn = sprk.Spark_Context()
    lines = conn.textFile("/Users/shuvamoymondal/Downloads/emp.txt").map(
        lambda v: v.split(",")).map(lambda g: (g[5], float(g[4])))

print(lines.collect())
v = lines.map(lambda h: h[1]).max()
print(v)