Python get_api示例，dcp.storage.base.get_api Python示例

示例#1

0

显示文件

 def cast_to_field_type(self, name: str, storage: storage.Storage,
                        field: str, field_type: FieldType):
     df = storage.get_api().get(name)
     cast(DataFrame, df)
     if field in df.columns:
         df[field] = cast_series_to_field_type(df[field], field_type)
     storage.get_api().put(name, df)  # Unnecessary?

示例#2

0

显示文件

 def cast_to_field_type(self, name: str, storage: storage.Storage,
                        field: str, field_type: FieldType):
     records = storage.get_api().get(name)
     for r in records:
         if field in r:
             r[field] = cast_python_object_to_field_type(
                 r[field], field_type)
     storage.get_api().put(name, records)

示例#3

0

显示文件

 def create_empty(self, name: str, storage: storage.Storage,
                  schema: Schema):
     table = schema_as_sqlalchemy_table(
         schema,
         name,
         field_type_parameter_defaults={Text: {
             "length": 255
         }})
     storage.get_api().create_sqlalchemy_table(table)

示例#4

0

显示文件

文件： base.py 项目： kvh/dcp

 def infer_field_type(self, name: str, storage: storage.Storage,
                      field: str) -> FieldType:
     tble: sa.Table = storage.get_api().get_as_sqlalchemy_table(name)
     for c in tble.columns:
         if c.name == field:
             return sqlalchemy_type_to_field_type(c.type)
     raise ValueError(f"Field does not exist: {field}")

示例#5

0

显示文件

文件： csv_file.py 项目： kvh/dcp

 def infer_field_names(self, name, storage) -> List[str]:
     with storage.get_api().open(name) as f:
         dialect = infer_csv_dialect(f.read(SAMPLE_SIZE_CHARACTERS))
         f.seek(0)
         ln = f.readline()
         headers = next(csv.reader([ln], dialect=dialect))
         return headers

示例#6

0

显示文件

文件： csv_lines_iterator.py 项目： kvh/dcp

 def get_sample_records(self, name: str,
                        storage: storage.Storage) -> Records:
     obj = storage.get_api().get(name)
     assert isinstance(obj, SampleableIterator)
     sample = obj.head(SAMPLE_SIZE_LINES)
     for r in read_csv(sample):
         yield r

示例#7

0

显示文件

 def infer_field_type(self, name: str, storage: storage.Storage,
                      field: str) -> FieldType:
     df = storage.get_api().get(name)
     cast(DataFrame, df)
     series = df[field]
     ft = pandas_series_to_field_type(series)
     return ft

示例#8

0

显示文件

文件： csv_lines_iterator.py 项目： kvh/dcp

 def infer_data_format(self, name: str,
                       storage: storage.Storage) -> Optional[DataFormat]:
     obj = storage.get_api().get(name)
     if isinstance(obj, SampleableIterator):
         s = self.get_sample_string(name, storage)
         if is_maybe_csv(s):
             return CsvLinesIteratorFormat
     return None

示例#9

0

显示文件

文件： csv_file.py 项目： kvh/dcp

 def infer_data_format(self, name: str,
                       storage: storage.Storage) -> Optional[DataFormat]:
     if name.endswith(".csv"):
         return CsvFileFormat
     # TODO: how hacky is this? very
     with storage.get_api().open(name) as f:
         s = f.read(SAMPLE_SIZE_CHARACTERS)
         if is_maybe_csv(s):
             return CsvFileFormat
     return None

示例#10

0

显示文件

 def infer_data_format(
     self, name: str, storage: storage.Storage
 ) -> Optional[DataFormat]:
     if name.endswith(".html"):
         return HtmlFileFormat
     # TODO: how hacky is this? very
     with storage.get_api().open(name) as f:
         s = f.read(SAMPLE_SIZE_CHARACTERS)
         if s.strip().lower().startswith("<html"):
             return HtmlFileFormat
     return None

示例#11

0

显示文件

 def infer_field_type(self, name: str, storage: storage.Storage,
                      field: str) -> FieldType:
     records = storage.get_api().get(name)
     sample = []
     for r in records:
         if field in r:
             sample.append(r[field])
         if len(sample) >= self.sample_size:
             break
     ft = select_field_type(sample)
     return ft

示例#12

0

显示文件

 def infer_data_format(self, name, storage) -> Optional[DataFormat]:
     obj = storage.get_api().get(name)
     if isinstance(obj, list):
         if len(obj) > 0:
             if isinstance(obj[0], dict):
                 return RecordsFormat
             else:
                 return None
         # If empty list, default to records format
         return RecordsFormat
     return None

示例#13

0

显示文件

 def infer_field_names(self, name, storage) -> List[str]:
     records = storage.get_api().get(name)
     assert isinstance(records, list)
     if not records:
         return []
     names = []
     for r in records[:100]:
         for k in r.keys():  # Ordered as of py 3.7
             if k not in names:
                 names.append(k)  # Keep order
         # names |= set(r.keys())
     return list(names)

示例#14

0

显示文件

文件： json_lines_file.py 项目： kvh/dcp

 def infer_data_format(self, name: str,
                       storage: storage.Storage) -> Optional[DataFormat]:
     if name.endswith(".jsonl"):
         return JsonLinesFileFormat
     # TODO: how hacky is this? very
     with storage.get_api().open(name) as f:
         ln = f.readline()
         try:
             json.loads(ln)
             return JsonLinesFileFormat
         except json.JSONDecodeError:
             pass
     return None

示例#15

0

显示文件

 def create_empty(self, name, storage, schema: Schema):
     df = DataFrame()
     for field in schema.fields:
         pd_type = field_type_to_pandas_dtype(field.field_type)
         df[field.name] = pd.Series(dtype=pd_type)
     storage.get_api().put(name, df)

示例#16

0

显示文件

 def infer_field_names(self, name, storage) -> List[str]:
     return storage.get_api().get(name).columns

示例#17

0

显示文件

文件： csv_lines_iterator.py 项目： kvh/dcp

 def create_empty(self, name, storage, schema: Schema):
     s = ",".join(schema.field_names()) + "\n"
     storage.get_api().put(name, (ln for ln in [s]))

示例#18

0

显示文件

文件： csv_lines_iterator.py 项目： kvh/dcp

 def get_sample_string(self, name: str, storage: storage.Storage) -> str:
     obj = storage.get_api().get(name)
     assert isinstance(obj, SampleableIterator)
     sample = obj.head(SAMPLE_SIZE_LINES)
     s = "".join(sample)
     return s

示例#19

0

显示文件

文件： csv_file.py 项目： kvh/dcp

 def create_empty(self, name, storage, schema: Schema):
     # Not sure you'd really ever want to do this?
     with storage.get_api().open(name, "w") as f:
         f.write(",".join(schema.field_names()) + "\n")

示例#20

0

显示文件

 def create_empty(self, name, storage, schema: Schema):
     storage.get_api().put(name, [])

示例#21

0

显示文件

文件： base.py 项目： kvh/dcp

 def infer_field_names(self, name, storage) -> List[str]:
     tble = storage.get_api().get_as_sqlalchemy_table(name)
     return [c.name for c in tble.columns]

示例#22

0

显示文件

 def create_empty(self, name, storage, schema: Schema):
     # Not sure you'd really ever want to do this?
     with storage.get_api().open(name, "w") as f:
         pass

示例#23

0

显示文件

文件： arrow_table.py 项目： kvh/dcp

 def infer_field_type(self, name: str, storage: storage.Storage,
                      field: str) -> FieldType:
     table: ArrowTable = storage.get_api().get(name)
     return arrow_type_to_field_type(str(table.field(field).type))

示例#24

0

显示文件

文件： arrow_table.py 项目： kvh/dcp

 def create_empty(self, name, storage, schema: Schema):
     table = pa.Table.from_batches([],
                                   schema=schema_to_arrow_schema(schema))
     storage.get_api().put(name, table)

示例#25

0

显示文件

文件： arrow_table.py 项目： kvh/dcp

 def infer_field_names(self, name, storage) -> List[str]:
     table = storage.get_api().get(name)
     assert isinstance(table, ArrowTable)
     return [f.name for f in table.schema]

示例#26

0

显示文件

文件： arrow_table.py 项目： kvh/dcp

 def infer_data_format(self, name, storage) -> Optional[DataFormat]:
     obj = storage.get_api().get(name)
     if isinstance(obj, pa.Table):
         return ArrowTableFormat
     return None

示例#27

0

显示文件

文件： json_lines_file.py 项目： kvh/dcp

 def create_empty(self, name, storage, schema: Schema):
     # Just "touch"
     with storage.get_api().open(name, "w"):
         pass

示例#28

0

显示文件

文件： json_lines_file.py 项目： kvh/dcp

 def infer_field_names(self, name, storage) -> List[str]:
     with storage.get_api().open(name) as f:
         ln = f.readline()
         return [k for k in json.loads(ln).keys()]

示例#29

0

显示文件

文件： base.py 项目： kvh/dcp

 def create_empty(self, name, storage, schema: Schema):
     table = schema_as_sqlalchemy_table(schema, name)
     storage.get_api().create_sqlalchemy_table(table)