def test_to_parquet(sample_df, tmpdir): dt = DataTable(sample_df, index='id') dt.to_parquet(str(tmpdir)) _dt = deserialize.read_datatable(str(tmpdir)) pd.testing.assert_frame_equal( to_pandas(dt.to_dataframe(), index=dt.index, sort_index=True), to_pandas(_dt.to_dataframe(), index=_dt.index, sort_index=True)) assert dt == _dt
def test_serialize_s3_parquet_anon(sample_df, s3_client, s3_bucket): xfail_tmp_disappears(sample_df) dt = DataTable(sample_df) dt.to_parquet(TEST_S3_URL, profile_name=False) make_public(s3_client, s3_bucket) _dt = deserialize.read_datatable(TEST_S3_URL, profile_name=False) pd.testing.assert_frame_equal( to_pandas(dt.to_dataframe(), index=dt.index), to_pandas(_dt.to_dataframe(), index=_dt.index)) assert dt == _dt
def test_to_parquet_with_latlong(latlong_df, tmpdir): dt = DataTable( latlong_df, logical_types={col: 'LatLong' for col in latlong_df.columns}) dt.to_parquet(str(tmpdir)) _dt = deserialize.read_datatable(str(tmpdir)) pd.testing.assert_frame_equal( to_pandas(dt.to_dataframe(), index=dt.index, sort_index=True), to_pandas(_dt.to_dataframe(), index=_dt.index, sort_index=True)) assert dt == _dt