Python CardoDataFrame.rdd示例

编程语言: Python

命名空间/包名称: CardoExecutor.Common.CardoDataFrame

类/类型: CardoDataFrame

方法/功能: rdd

hotexamples.com的示例: 2

Python CardoDataFrame.rdd - 已找到2个示例。这些是从开源项目中提取的最受好评的CardoExecutor.Common.CardoDataFrame.CardoDataFrame.rdd现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

CardoDataFrame(30)

dataframe(5)

persist(2)

rdd(2)

unpersist(2)

pandas(1)

示例#1

显示文件

 def test_set_rdd(self):
     first_dataset = self.context.spark.createDataFrame([['a']],
                                                        'column1: string')
     second_dataset = self.context.spark.sparkContext.parallelize(
         [Row(column1='aa')])
     cardo_dataframe = CardoDataFrame(first_dataset, '6')
     cardo_dataframe.rdd = second_dataset
     self.assertItemsEqual(second_dataset.collect(),
                           cardo_dataframe.dataframe.collect())
     self.assertItemsEqual(second_dataset.collect(),
                           cardo_dataframe.rdd.collect())

示例#2

显示文件

    def test_unpersist_rdd(self):
        # Arrange
        rdd = self.context.spark.sparkContext.parallelize([Row(column1='aa')])
        second_rdd = self.context.spark.sparkContext.parallelize(
            [Row(column1='bb')])
        cardo_dataframe = CardoDataFrame(rdd, '')
        cardo_dataframe.persist()
        cardo_dataframe.rdd = second_rdd

        # Act
        cardo_dataframe.unpersist()

        # Assert
        self.assertFalse(rdd.is_cached)