Python sparkle_df示例

编程语言: Python

命名空间/包名称: sparkle_session.dataframe

方法/功能: sparkle_df

hotexamples.com的示例: 8

Python sparkle_df - 已找到8个示例。这些是从开源项目中提取的最受好评的sparkle_session.dataframe.sparkle_df现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

 def test_cols_same(self):
     df1 = self.spark.createDataFrame([(1, 2)], ["a", "b"])
     df2 = self.spark.createDataFrame([(1, 2)], ["b", "c"])
     sdf1 = sparkle_df(df1)
     sdf2 = sparkle_df(df2)
     self.assertEqual(len(sdf1.columns), len(sdf2.columns))
     self.assertTrue(sdf1.hasSameColumns(sdf1))
     self.assertTrue(sdf2.hasSameColumns(sdf2))
     self.assertFalse(sdf1.hasSameColumns(sdf2))
     self.assertFalse(sdf2.hasSameColumns(sdf1))

示例#2

显示文件

 def test_require_column(self):
     df1 = self.spark.createDataFrame([(1, 2)], ["a", "b"])
     sdf1 = sparkle_df(df1)
     sdf1.requireColumn("a")
     sdf1.requireColumn("b")
     sdf1.requireColumn(("a", LongType))
     # noinspection PyTypeChecker
     sdf1.requireColumn(("b", LongType()))

示例#3

显示文件

 def test_all_any(self):
     df = self.spark.createDataFrame([(1, 2), (3, 4)], ["a", "b"])
     sdf = sparkle_df(df)
     self.assertIsNotNone(sdf)
     self.assertEqual(1, sdf.filter("a == 1").count())
     self.assertFalse(sdf.all('a == 1'))
     self.assertTrue(sdf.all('a == 1 OR a == 3'))
     self.assertTrue(sdf.any('a == 1'))

示例#4

显示文件

    def test_stay_sparkle(self):
        df1 = self.spark.createDataFrame([(1, )], ["a"])
        sdf1 = sparkle_df(df1)
        self.assertIsInstance(sdf1, SparkleDataFrame)
        self.assertIsInstance(sdf1.select("a"), SparkleDataFrame)
        self.assertIsInstance(sdf1.drop("a"), SparkleDataFrame)
        self.assertIsInstance(sdf1.sort('a'), SparkleDataFrame)
        self.assertIsInstance(sdf1.schema, SparkleStructType)

        self.assertIsInstance(
            sdf1.groupBy('a').agg(f.max('a'), f.max('a')), SparkleDataFrame)

示例#5

显示文件

 def setUp(self):
     s = SparkSession.builder.getOrCreate()
     s.sql("DROP TABLE IF EXISTS foo")
     df = s.createDataFrame([(1, 2)], ["a", "b"])
     self.df = sparkle_df(df)
     self.spark.conf.unset("spark.app.env")

示例#6

显示文件

 def setUp(self):
     df = self.spark.createDataFrame([(1, 2), (3, 4)], ["a", "b"])
     self.sdf = sparkle_df(df)

示例#7

显示文件

 def test_max_value(self):
     df1 = self.spark.createDataFrame([(1, ), (2, ), (0, )], ["a"])
     sdf1 = sparkle_df(df1)
     self.assertEqual(2, sdf1.maxValue("a"))

示例#8

显示文件

 def test_drop(self):
     df = self.spark.createDataFrame([(1, "y"), (3, "z")], ["a", "b"])
     sdf = sparkle_df(df)
     self.assertNotIn("a", sdf.dropOfType('bigint').columns)
     self.assertIn("b", sdf.dropOfType('bigint').columns)
     self.assertNotIn("b", sdf.dropOfType('string').columns)