Python SparkContext.paralellize示例

编程语言: Python

命名空间/包名称: pyspark

类/类型: SparkContext

方法/功能: paralellize

hotexamples.com的示例: 1

Python SparkContext.paralellize - 已找到1个示例。这些是从开源项目中提取的最受好评的pyspark.SparkContext.paralellize现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

setLogLevel(30)

setSystemProperty(30)

setCheckpointDir(30)

getConf(30)

parallelize(30)

pickleFile(30)

broadcast(30)

emptyRDD(30)

newAPIHadoopFile(30)

binaryFiles(30)

addPyFile(30)

addFile(30)

accumulator(30)

getOrCreate(30)

SparkContext(30)

sequenceFile(30)

newAPIHadoopRDD(25)

_ensure_initialized(14)

createDataFrame(11)

hadoopFile(10)

show_profiles(9)

range(8)

dump_profiles(6)

mongoRDD(6)

binaryRecords(6)

map(4)

setLocalProperty(3)

runJob(3)

flatMap(2)

cassandraTable(2)

collect(2)

close(2)

setJobGroup(2)

paralellize(1)

neo4jTable(1)

neo4jConfig(1)

parallelise(1)

BSONFileRDD(1)

parallelized(1)

parallize(1)

reduceByKey(1)

sample(1)

mongoPairRDD(1)

setMaster(1)

show_profile(1)

sortBy(1)

saveAsTextFile(1)

hadoopConfiguration(1)

mixin(1)

filter(1)

示例#1

0

显示文件

'''
Created on May 8, 2021

@author: SK050763
'''
# import findspark
# findspark.init('C:\Apps\spark-3.0.1-bin-hadoop2.7')
from pyspark.sql import SparkSession
from pyspark import SparkContext, SparkConf
#import os

spark = SparkSession.builder.getOrCreate()

sc = SparkContext(conf=SparkConf().setAppName("MyApp").setMaster("local"))

myRdd = sc.paralellize([
    1,
    2,
    3,
    5,
    25,
    32,
    678,
    23,
])

print(myRdd.take(5))