Python SparkConf.setSparkHome示例

编程语言: Python

命名空间/包名称: pyspark

类/类型: SparkConf

方法/功能: setSparkHome

hotexamples.com的示例: 2

Python SparkConf.setSparkHome - 已找到2个示例。这些是从开源项目中提取的最受好评的pyspark.SparkConf.setSparkHome现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

SparkConf(30)

set(30)

setAll(30)

setAppName(30)

setMaster(30)

get(20)

getAll(13)

setExecutorEnv(13)

toDebugString(7)

setIfMissing(4)

contains(1)

read(1)

setExectorMemory(1)

setExecutorCores(1)

setSparkHome(1)

textFile(1)

示例#1

显示文件

文件： main.py 项目： hwaohung/spark_train

from pyspark.mllib.classification import SVMWithSGD
from pyspark import SparkContext
from pyspark import SparkConf

from convert import *
from reduce_dimension import *


app_name = "WordCount"
spark_master = "spark://Kingdom:7077"
spark_home = "../spark-1.3.1-bin-hadoop2.4"

conf = SparkConf()
conf.setMaster(spark_master)
conf.setSparkHome(spark_home)
conf.setAppName(app_name)
conf.set("spark.executor.memory", "1g")
#conf.set("spark.akka.frameSize", "100")
#conf.set("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
#conf.set("spark.kryoserializer.buffer.mb", "64")
#conf.set("spark.executor.extraJavaOptions", "-XX:+UseCompressedOops")
#conf.set("spark.storage.memoryFraction", "0.6")
sc = SparkContext(conf=conf, pyFiles=["main.py", "convert.py", "attributes.py"])


# Return the sorted label, and the weight list
def get_sorted_label(training_data):
    rdd = training_data.map(lambda x: int(x.label))
    items = sorted(rdd.countByValue().items(), key=lambda x: x[0])

示例#2

显示文件

from collections import Counter

from pyspark.mllib.classification import SVMWithSGD
from pyspark import SparkContext
from pyspark import SparkConf

from convert import *
from reduce_dimension import *

app_name = "WordCount"
spark_master = "spark://Kingdom:7077"
spark_home = "../spark-1.3.1-bin-hadoop2.4"

conf = SparkConf()
conf.setMaster(spark_master)
conf.setSparkHome(spark_home)
conf.setAppName(app_name)
conf.set("spark.executor.memory", "1g")
#conf.set("spark.akka.frameSize", "100")
#conf.set("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
#conf.set("spark.kryoserializer.buffer.mb", "64")
#conf.set("spark.executor.extraJavaOptions", "-XX:+UseCompressedOops")
#conf.set("spark.storage.memoryFraction", "0.6")
sc = SparkContext(conf=conf,
                  pyFiles=["main.py", "convert.py", "attributes.py"])


# Return the sorted label, and the weight list
def get_sorted_label(training_data):
    rdd = training_data.map(lambda x: int(x.label))
    items = sorted(rdd.countByValue().items(), key=lambda x: x[0])