Python _to_java_object_rdd示例

编程语言: Python

命名空间/包名称: pyspark.mllib.common

方法/功能: _to_java_object_rdd

hotexamples.com的示例: 8

Python _to_java_object_rdd - 已找到8个示例。这些是从开源项目中提取的最受好评的pyspark.mllib.common._to_java_object_rdd现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

 def train(cls, rdd, k, maxIterations=100, runs=1, initializationMode="k-means||"):
     """Train a k-means clustering model."""
     # cache serialized data to avoid objects over head in JVM
     jcached = _to_java_object_rdd(rdd.map(_convert_to_vector), cache=True)
     model = callMLlibFunc("trainKMeansModel", jcached, k, maxIterations, runs,
                           initializationMode)
     centers = callJavaFunc(rdd.context, model.clusterCenters)
     return KMeansModel([c.toArray() for c in centers])

示例#2

显示文件

def _regression_train_wrapper(train_func, modelClass, data, initial_weights):
    first = data.first()
    if not isinstance(first, LabeledPoint):
        raise ValueError("data should be an RDD of LabeledPoint, but got %s" % first)
    initial_weights = initial_weights or [0.0] * len(data.first().features)
    weights, intercept = train_func(_to_java_object_rdd(data, cache=True),
                                    _convert_to_vector(initial_weights))
    return modelClass(weights, intercept)

示例#3

显示文件

文件： recommendation.py 项目： SainathNaga/spark

 def _prepare(cls, ratings):
     assert isinstance(ratings, RDD), "ratings should be RDD"
     first = ratings.first()
     if not isinstance(first, Rating):
         if isinstance(first, (tuple, list)):
             ratings = ratings.map(lambda x: Rating(*x))
         else:
             raise ValueError("rating should be RDD of Rating or tuple/list")
     return _to_java_object_rdd(ratings, True)

示例#4

显示文件

 def _prepare(cls, ratings):
     assert isinstance(ratings, RDD), "ratings should be RDD"
     first = ratings.first()
     if not isinstance(first, Rating):
         if isinstance(first, (tuple, list)):
             ratings = ratings.map(lambda x: Rating(*x))
         else:
             raise ValueError(
                 "rating should be RDD of Rating or tuple/list")
     return _to_java_object_rdd(ratings, True)

示例#5

显示文件

文件： tests.py 项目： bopopescu/SparkNew

 def test_to_java_object_rdd(self):  # SPARK-6660
     data = RandomRDDs.uniformRDD(self.sc, 10, 5, seed=0L)
     self.assertEqual(_to_java_object_rdd(data).count(), 10)

示例#6

显示文件

文件： tests.py 项目： HodaAlemi/spark

 def test_to_java_object_rdd(self):  # SPARK-6660
     data = RandomRDDs.uniformRDD(self.sc, 10, 5, seed=0)
     self.assertEqual(_to_java_object_rdd(data).count(), 10)

示例#7

显示文件

文件： regression.py 项目： llynosy/spark

def _regression_train_wrapper(train_func, modelClass, data, initial_weights):
    initial_weights = initial_weights or [0.0] * len(data.first().features)
    weights, intercept = train_func(_to_java_object_rdd(data, cache=True),
                                    _convert_to_vector(initial_weights))
    return modelClass(weights, intercept)

示例#8

显示文件

文件： regression.py 项目： BViki/spark

def _regression_train_wrapper(train_func, modelClass, data, initial_weights):
    initial_weights = initial_weights or [0.0] * len(data.first().features)
    weights, intercept = train_func(_to_java_object_rdd(data, cache=True),
                                    _convert_to_vector(initial_weights))
    return modelClass(weights, intercept)