Python RDD.init Exemples

Langage de programmation: Python

Espace de nommage/Pack: pyspark

Class/Type: RDD

Méthode/Fonction: __init__

Exemples au hotexamples.com: 4

Python RDD.__init__ - 4 exemples trouvés. Ce sont les exemples réels les mieux notés de pyspark.RDD.__init__ extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

RDD(30)

map(30)

flatMap(16)

count(11)

mapPartitionsWithIndex(10)

getNumPartitions(9)

filter(9)

repartition(6)

mapPartitions(6)

toDF(5)

collect(5)

mapValues(5)

groupByKey(4)

isEmpty(4)

coalesce(3)

cache(3)

take(3)

toDebugString(2)

persist(2)

unpersist(2)

zip(2)

zipWithIndex(2)

__init__(2)

_reserialize(2)

first(2)

distinct(2)

join(2)

sum(1)

_to_java_object_rdd(1)

union(1)

cogroup(1)

countApproxDistinct(1)

sortByKey(1)

subtractByKey(1)

sortBy(1)

sample(1)

randomSplit(1)

foreach(1)

name(1)

groupBy(1)

keys(1)

Méthodes fréquemment utilisées

RDD (30)

map (30)

flatMap (16)

count (11)

mapPartitionsWithIndex (10)

getNumPartitions (9)

filter (9)

repartition (6)

mapPartitions (6)

toDF (5)

Méthodes fréquemment utilisées

collect (5)

mapValues (5)

groupByKey (4)

isEmpty (4)

coalesce (3)

cache (3)

take (3)

toDebugString (2)

persist (2)

unpersist (2)

zip (2)

zipWithIndex (2)

__init__ (2)

_reserialize (2)

first (2)

distinct (2)

join (2)

sum (1)

_to_java_object_rdd (1)

union (1)

Méthodes fréquemment utilisées

zip (2)

zipWithIndex (2)

__init__ (2)

_reserialize (2)

first (2)

distinct (2)

join (2)

sum (1)

_to_java_object_rdd (1)

union (1)

cogroup (1)

countApproxDistinct (1)

sortByKey (1)

subtractByKey (1)

sortBy (1)

sample (1)

randomSplit (1)

foreach (1)

name (1)

groupBy (1)

keys (1)

Méthodes fréquemment utilisées

cogroup (1)

countApproxDistinct (1)

sortByKey (1)

subtractByKey (1)

sortBy (1)

sample (1)

randomSplit (1)

foreach (1)

name (1)

groupBy (1)

keys (1)

Exemple #1

0

Afficher le fichier

def __init__(self, dt_index, rdd, jtsrdd=None, sc=None): if jtsrdd == None: # Construct from a Python RDD object and a Python DateTimeIndex jvm = rdd.ctx._jvm jrdd = rdd._reserialize(_TimeSeriesSerializer())._jrdd.mapToPair( \ jvm.com.cloudera.sparkts.BytesToKeyAndSeries()) self._jtsrdd = jvm.com.cloudera.sparkts.api.java.JavaTimeSeriesRDDFactory.timeSeriesRDD( \ dt_index._jdt_index, jrdd) RDD.__init__(self, rdd._jrdd, rdd.ctx) else: # Construct from a py4j.JavaObject pointing to a JavaTimeSeriesRDD and a Python SparkContext jvm = sc._jvm jrdd = jtsrdd.map( \ jvm.com.cloudera.sparkts.KeyAndSeriesToBytes()) RDD.__init__(self, jrdd, sc, _TimeSeriesSerializer()) self._jtsrdd = jtsrdd

Exemple #2

0

Afficher le fichier

Fichier : timeseriesrdd.py Projet : superwaiwjia/spark-timeseries

def __init__(self, dt_index, rdd, jtsrdd = None, sc = None): if jtsrdd == None: # Construct from a Python RDD object and a Python DateTimeIndex jvm = rdd.ctx._jvm jrdd = rdd._reserialize(_TimeSeriesSerializer())._jrdd.map( \ jvm.com.cloudera.sparkts.BytesToKeyAndSeries()) self._jtsrdd = jvm.com.cloudera.sparkts.TimeSeriesRDD( \ dt_index._jdt_index, jrdd.rdd()) RDD.__init__(self, rdd._jrdd, rdd.ctx) else: # Construct from a py4j.JavaObject pointing to a TimeSeriesRDD and a Python SparkContext jvm = sc._jvm jrdd = jvm.org.apache.spark.api.java.JavaRDD(jtsrdd, None).map( \ jvm.com.cloudera.sparkts.KeyAndSeriesToBytes()) RDD.__init__(self, jrdd, sc, _TimeSeriesSerializer()) self._jtsrdd = jtsrdd

Exemple #3

0

Afficher le fichier

Fichier : transformable_rdd.py Projet : data-commons/prep-buddy

def __init__(self, rdd, file_type='CSV', t_rdd=None, sc=None): if rdd is not None: jvm = rdd.ctx._jvm java_import(jvm, ClassNames.BYTES_TO_STRING) java_import(jvm, ClassNames.TRANSFORMABLE_RDD) self.__set_file_type(jvm, file_type) self.spark_context = rdd.ctx java_rdd = rdd._reserialize(BuddySerializer())._jrdd.map(jvm.BytesToString()) self._transformable_rdd = jvm.JavaTransformableRDD(java_rdd, self.__file_type) RDD.__init__(self, rdd._jrdd, rdd.ctx) else: jvm = sc._jvm java_import(jvm, ClassNames.STRING_TO_BYTES) self.spark_context = sc self.__set_file_type(jvm, file_type) self._transformable_rdd = t_rdd rdd = t_rdd.map(jvm.StringToBytes()) RDD.__init__(self, rdd, sc, BuddySerializer())

Exemple #4

0

Afficher le fichier

Fichier : transformable_rdd.py Projet : veera83372/prep-buddy

def __init__(self, rdd, file_type='CSV', t_rdd=None, sc=None): if rdd is not None: jvm = rdd.ctx._jvm java_import(jvm, ClassNames.BYTES_TO_STRING) java_import(jvm, ClassNames.TRANSFORMABLE_RDD) self.__set_file_type(jvm, file_type) self.spark_context = rdd.ctx java_rdd = rdd._reserialize(BuddySerializer())._jrdd.map( jvm.BytesToString()) self._transformable_rdd = jvm.JavaTransformableRDD( java_rdd, self.__file_type) RDD.__init__(self, rdd._jrdd, rdd.ctx) else: jvm = sc._jvm java_import(jvm, ClassNames.STRING_TO_BYTES) self.spark_context = sc self.__set_file_type(jvm, file_type) self._transformable_rdd = t_rdd rdd = t_rdd.map(jvm.StringToBytes()) RDD.__init__(self, rdd, sc, BuddySerializer())

Python RDD.__init__ Exemples

Python RDD.init Exemples