Ejemplo n.º 1
0
def test_to_parquet(sample_df, tmpdir):
    dt = DataTable(sample_df, index='id')
    dt.to_parquet(str(tmpdir))
    _dt = deserialize.read_datatable(str(tmpdir))
    pd.testing.assert_frame_equal(
        to_pandas(dt.to_dataframe(), index=dt.index, sort_index=True),
        to_pandas(_dt.to_dataframe(), index=_dt.index, sort_index=True))
    assert dt == _dt
Ejemplo n.º 2
0
def test_serialize_s3_parquet_anon(sample_df, s3_client, s3_bucket):
    xfail_tmp_disappears(sample_df)

    dt = DataTable(sample_df)
    dt.to_parquet(TEST_S3_URL, profile_name=False)
    make_public(s3_client, s3_bucket)
    _dt = deserialize.read_datatable(TEST_S3_URL, profile_name=False)

    pd.testing.assert_frame_equal(
        to_pandas(dt.to_dataframe(), index=dt.index),
        to_pandas(_dt.to_dataframe(), index=_dt.index))
    assert dt == _dt
Ejemplo n.º 3
0
def test_to_parquet_with_latlong(latlong_df, tmpdir):
    dt = DataTable(
        latlong_df,
        logical_types={col: 'LatLong'
                       for col in latlong_df.columns})
    dt.to_parquet(str(tmpdir))
    _dt = deserialize.read_datatable(str(tmpdir))

    pd.testing.assert_frame_equal(
        to_pandas(dt.to_dataframe(), index=dt.index, sort_index=True),
        to_pandas(_dt.to_dataframe(), index=_dt.index, sort_index=True))
    assert dt == _dt