Python Row示例

编程语言: Python

命名空间/包名称: bermann.row

类/类型: Row

hotexamples.com的示例: 10

Python Row - 已找到10个示例。这些是从开源项目中提取的最受好评的bermann.row.Row现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Row(10)

asDict(4)

常用方法

Row (10)

asDict (4)

示例#1

显示文件

文件： dataframe.py 项目： duedil-ltd/bermann

    def _parse_from_list(self, input_rows, schema=None):
        # if schema:
        #     parsed_schema = self._parse_schema(schema)
        # else:
        #     first = input_rows[0]
        #     if not first:
        #         raise Exception('Cannot parse schema from blank data')
        #     if isinstance(first, dict):
        #         parsed_schema = self._infer_python_schema_from_dict(first)
        #     elif isinstance(first, Row):
        #         parsed_schema = self._infer_python_schema_from_row(first)
        #     else:
        #         raise Exception('Schema can only be parsed from dict or Row')

        rows = []

        for r in input_rows:
            if isinstance(r, dict):
                # assert len(r) == len(parsed_schema)
                # assert sorted(r.keys()) == sorted(parsed_schema.keys())
                # # TODO validate input types against schema?

                rows.append(Row(**r))
            elif isinstance(r, list) or isinstance(r, tuple):
                if not schema:
                    raise Exception("Schema required when creating DataFrame from list of list/tuple")
                # assert len(r) == len(parsed_schema)
                # # TODO validate input types against schema?
                # TODO this won't deal with nested Rows
                keys = [t.name for t in schema.fields]
                inputs = {}
                for idx, k in enumerate(keys):
                    inputs[k] = r[idx]
                rows.append(Row(**inputs))
            else:
                raise Exception("input rows must of type dict, list or tuple")

        return rows, schema

示例#2

显示文件

    def test_creation_from_rdd_of_rows(self):
        rdd = self.sc.parallelize([Row(a='a', b=123), Row(a='aa', b=456)])

        df = DataFrame(rdd)

        self.assertEqual(df.count(), 2)

示例#3

显示文件