Python TSDF.write Exemples

Langage de programmation: Python

Espace de nommage/Pack: tempo.tsdf

Class/Type: TSDF

Méthode/Fonction: write

Exemples au hotexamples.com: 2

Python TSDF.write - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de tempo.tsdf.TSDF.write extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

TSDF(16)

asofJoin(5)

resample(4)

calc_bars(2)

interpolate(2)

write(2)

describe(1)

fourier_transform(1)

withGroupedStats(1)

withRangeStats(1)

Méthodes fréquemment utilisées

TSDF (16)

asofJoin (5)

resample (4)

calc_bars (2)

interpolate (2)

write (2)

describe (1)

fourier_transform (1)

withGroupedStats (1)

withRangeStats (1)

Exemple #1

0

Afficher le fichier

Fichier : delta_writer_tests.py Projet : databrickslabs/tempo

def test_write_to_delta(self): """Test table write to delta format""" schema = StructType([ StructField("symbol", StringType()), StructField("date", StringType()), StructField("event_ts", StringType()), StructField("trade_pr", FloatType()), StructField("trade_pr_2", FloatType()) ]) data = [["S1", "SAME_DT", "2020-08-01 00:00:10", 349.21, 10.0], ["S1", "SAME_DT", "2020-08-01 00:00:11", 340.21, 9.0], ["S1", "SAME_DT", "2020-08-01 00:01:12", 353.32, 8.0], ["S1", "SAME_DT", "2020-08-01 00:01:13", 351.32, 7.0], ["S1", "SAME_DT", "2020-08-01 00:01:14", 350.32, 6.0], ["S1", "SAME_DT", "2020-09-01 00:01:12", 361.1, 5.0], ["S1", "SAME_DT", "2020-09-01 00:19:12", 362.1, 4.0]] # construct dataframe df = self.buildTestDF(schema, data) # convert to TSDF tsdf_left = TSDF(df, partition_cols=["symbol"], ts_col="event_ts") #test write to delta tsdf_left.write(self.spark, "my_table") logging.info('delta table count ' + str(self.spark.table("my_table").count())) # should be equal to the expected dataframe assert self.spark.table("my_table").count() == 7

Exemple #2

0

Afficher le fichier

def test_write_to_delta(self): """Test of range stats for 20 minute rolling window""" schema = StructType([ StructField("symbol", StringType()), StructField("date", StringType()), StructField("event_ts", StringType()), StructField("trade_pr", FloatType()), StructField("trade_pr_2", FloatType()) ]) expectedSchema = StructType([ StructField("symbol", StringType()), StructField("event_ts", StringType()), StructField("date", StringType()), StructField("trade_pr_2", FloatType()), StructField("trade_pr", FloatType()) ]) data = [["S1", "SAME_DT", "2020-08-01 00:00:10", 349.21, 10.0], ["S1", "SAME_DT", "2020-08-01 00:00:11", 340.21, 9.0], ["S1", "SAME_DT", "2020-08-01 00:01:12", 353.32, 8.0], ["S1", "SAME_DT", "2020-08-01 00:01:13", 351.32, 7.0], ["S1", "SAME_DT", "2020-08-01 00:01:14", 350.32, 6.0], ["S1", "SAME_DT", "2020-09-01 00:01:12", 361.1, 5.0], ["S1", "SAME_DT", "2020-09-01 00:19:12", 362.1, 4.0]] expected_data = [[ "S1", "2020-08-01 00:00:00", "SAME_DT", 10.0, 349.21 ], ["S1", "2020-08-01 00:01:00", "SAME_DT", 8.0, 353.32], ["S1", "2020-09-01 00:01:00", "SAME_DT", 5.0, 361.1], ["S1", "2020-09-01 00:19:00", "SAME_DT", 4.0, 362.1]] # construct dataframes df = self.buildTestDF(schema, data) dfExpected = self.buildTestDF(expectedSchema, expected_data) # convert to TSDF tsdf_left = TSDF(df, partition_cols=["symbol"]) # using lookback of 20 minutes #featured_df = tsdf_left.resample(freq = "min", func = "closest_lead").df tsdf_left.write(self.spark, "my_table") print('delta table count ' + str(self.spark.table("my_table").count())) # should be equal to the expected dataframe assert self.spark.table("my_table").count() == 7