Python TabularData Exemples, dvc.compare.TabularData Python Exemples

Exemple #1

0

Afficher le fichier

Fichier : test_tabular_data.py Projet : ush98/dvc

def test_row_from_dict():
    td = TabularData(["col1", "col2"])
    td.row_from_dict({"col3": "value3", "col4": "value4"})
    assert td.keys() == ["col1", "col2", "col3", "col4"]
    assert dict(td.items()) == {
        "col1": [""],
        "col2": [""],
        "col3": ["value3"],
        "col4": ["value4"],
    }
    td.row_from_dict({"col3": "value3", "col5": "value5", "col6": "value6"})
    assert td.keys() == ["col1", "col2", "col3", "col4", "col5", "col6"]
    assert dict(td.items()) == {
        "col1": ["", ""],
        "col2": ["", ""],
        "col3": ["value3", "value3"],
        "col4": ["value4", ""],
        "col5": ["", "value5"],
        "col6": ["", "value6"],
    }
    assert td.shape == (6, 2)
    assert list(td) == [
        ["", "", "value3", "value4", "", ""],
        ["", "", "value3", "", "value5", "value6"],
    ]

Exemple #2

0

Afficher le fichier

Fichier : experiments.py Projet : isidentical/dvc

def experiments_table(
    all_experiments,
    headers,
    metric_headers,
    metric_names,
    param_headers,
    param_names,
    sort_by=None,
    sort_order=None,
    precision=DEFAULT_PRECISION,
    fill_value=FILL_VALUE,
    iso=False,
) -> "TabularData":
    from funcy import lconcat

    from dvc.compare import TabularData

    td = TabularData(lconcat(headers, metric_headers, param_headers),
                     fill_value=fill_value)
    for base_rev, experiments in all_experiments.items():
        rows = _collect_rows(
            base_rev,
            experiments,
            metric_names,
            param_names,
            sort_by=sort_by,
            sort_order=sort_order,
            precision=precision,
            fill_value=fill_value,
            iso=iso,
        )
        td.extend(rows)

    return td

Exemple #3

0

Afficher le fichier

def experiments_table(
    all_experiments,
    metric_headers,
    metric_names,
    param_headers,
    param_names,
    sort_by=None,
    sort_order=None,
    precision=DEFAULT_PRECISION,
) -> "TabularData":
    from funcy import lconcat

    from dvc.compare import TabularData

    headers = ["Experiment", "rev", "queued", "typ", "Created", "parent"]
    td = TabularData(lconcat(headers, metric_headers, param_headers),
                     fill_value=FILL_VALUE)
    for base_rev, experiments in all_experiments.items():
        rows = _collect_rows(
            base_rev,
            experiments,
            metric_names,
            param_names,
            sort_by=sort_by,
            sort_order=sort_order,
            precision=precision,
        )
        td.extend(rows)

    return td

Exemple #4

0

Afficher le fichier

Fichier : test_parallel_coordinates.py Projet : pared/dvc

def test_write_parallel_coordinates(tmp_dir):
    td = TabularData(["categorical", "scalar"])
    td.extend([["foo", "0.1"], ["bar", "2"]])

    renderer = ParallelCoordinatesRenderer(td)
    html_path = write(tmp_dir, renderers=[renderer])

    html_text = html_path.read_text()

    assert ParallelCoordinatesRenderer.SCRIPTS in html_text

    div = ParallelCoordinatesRenderer.DIV.format(id="plot_experiments",
                                                 partial=renderer.as_json())
    assert div in html_text

Exemple #5

0

Afficher le fichier

Fichier : test_parallel_coordinates.py Projet : pared/dvc

def test_color_by_scalar():
    td = TabularData(["categorical", "scalar"])
    td.extend([["foo", "0.1"], ["bar", "2"]])
    renderer = ParallelCoordinatesRenderer(td, color_by="scalar")

    result = json.loads(renderer.as_json())

    assert expected_format(result)
    assert result["data"][0]["line"] == {
        "color": [0.1, 2.0],
        "showscale": True,
        "colorbar": {
            "title": "scalar"
        },
    }

Exemple #6

0

Afficher le fichier

    def _add_row(
        self,
        name: str,
        all_status: List[Dict],
        td: TabularData,
    ):

        if not all_status:
            row = [name, None, "offline"]
            td.append(row)
        for i, status in enumerate(all_status, start=1):
            row = [name, f"num_{i}", "running" if status else "offline"]
            for field in self.SHOWN_FIELD:
                value = str(status.get(field, ""))
                row.append(value)
            td.append(row)

Exemple #7

0

Afficher le fichier

Fichier : test_tabular_data.py Projet : ush98/dvc

def test_list_operations():
    td = TabularData(["col1", "col2", "col3"])
    td.append(["1", "2", "3"])

    assert list(td) == [["1", "2", "3"]]
    td.extend((["11", "12", "13"], ["21", "22", "23"]))
    assert list(td) == [
        ["1", "2", "3"],
        ["11", "12", "13"],
        ["21", "22", "23"],
    ]
    td.insert(1, ["01", "02", "03"])
    assert list(td) == [
        ["1", "2", "3"],
        ["01", "02", "03"],
        ["11", "12", "13"],
        ["21", "22", "23"],
    ]
    assert td.shape == (3, 4)
    assert len(td) == 4
    assert td[1] == ["01", "02", "03"]
    assert td[1:] == [
        ["01", "02", "03"],
        ["11", "12", "13"],
        ["21", "22", "23"],
    ]
    assert td[::-1] == [
        ["21", "22", "23"],
        ["11", "12", "13"],
        ["01", "02", "03"],
        ["1", "2", "3"],
    ]
    del td[1]
    assert list(td) == [
        ["1", "2", "3"],
        ["11", "12", "13"],
        ["21", "22", "23"],
    ]
    assert td.shape == (3, 3)
    td[1:3] = [["51", "52", "53"], ["61", "62", "63"]]
    assert list(td) == [
        ["1", "2", "3"],
        ["51", "52", "53"],
        ["61", "62", "63"],
    ]
    td[1] = ["41", "42", "43"]
    assert td[1] == ["41", "42", "43"]

    del td[1:3]
    assert td.shape == (3, 1)

    assert td.to_csv() == "col1,col2,col3\r\n1,2,3\r\n"

Exemple #8

0

Afficher le fichier

Fichier : test_tabular_data.py Projet : ush98/dvc

def test_drop():
    td = TabularData(["col1", "col2", "col3"])
    td.append(["foo", "bar", "baz"])
    assert list(td) == [["foo", "bar", "baz"]]
    td.drop("col2")
    assert td.keys() == ["col1", "col3"]
    assert list(td) == [["foo", "baz"]]

Exemple #9

0

Afficher le fichier

Fichier : machine.py Projet : pared/dvc

 def _show_table(self):
     td = TabularData(self.TABLE_COLUMNS, fill_value="-")
     conf = self.config.read()["machine"]
     if self.args.name:
         conf = {self.args.name: conf.get(self.args.name, {})}
     self._hide_private(conf)
     for machine, machine_config in conf.items():
         machine_config["name"] = machine
         td.row_from_dict(machine_config)
     td.dropna("cols", "all")
     td.render()

Exemple #10

0

Afficher le fichier

Fichier : test_parallel_coordinates.py Projet : pared/dvc

def test_mixed_columns():
    td = TabularData(["categorical", "scalar"])
    td.extend([["foo", "0.1"], ["bar", "2"]])
    renderer = ParallelCoordinatesRenderer(td)

    result = json.loads(renderer.as_json())

    assert expected_format(result)

    assert result["data"][0]["dimensions"][0] == {
        "label": "categorical",
        "values": [1, 0],
        "tickvals": [1, 0],
        "ticktext": ["foo", "bar"],
    }
    assert result["data"][0]["dimensions"][1] == {
        "label": "scalar",
        "values": [0.1, 2.0],
    }

Exemple #11

0

Afficher le fichier

Fichier : test_parallel_coordinates.py Projet : pared/dvc

def test_fill_value():
    td = TabularData(["categorical", "scalar"])
    td.extend([["foo", "-"], ["-", "2"]])
    renderer = ParallelCoordinatesRenderer(td, fill_value="-")

    result = json.loads(renderer.as_json())

    assert expected_format(result)

    assert result["data"][0]["dimensions"][0] == {
        "label": "categorical",
        "values": [0, 1],
        "tickvals": [0, 1],
        "ticktext": ["foo", "Missing"],
    }
    assert result["data"][0]["dimensions"][1] == {
        "label": "scalar",
        "values": [None, 2.0],
    }

Exemple #12

0

Afficher le fichier

Fichier : test_parallel_coordinates.py Projet : pared/dvc

def test_categorical_columns():
    td = TabularData(["col-1", "col-2"])
    td.extend([["foo", ""], ["bar", "foobar"], ["foo", ""]])
    renderer = ParallelCoordinatesRenderer(td)

    result = json.loads(renderer.as_json())

    assert expected_format(result)

    assert result["data"][0]["dimensions"][0] == {
        "label": "col-1",
        "values": [1, 0, 1],
        "tickvals": [1, 0, 1],
        "ticktext": ["foo", "bar", "foo"],
    }
    assert result["data"][0]["dimensions"][1] == {
        "label": "col-2",
        "values": [1, 0, 1],
        "tickvals": [1, 0, 1],
        "ticktext": ["Missing", "foobar", "Missing"],
    }

Exemple #13

0

Afficher le fichier

Fichier : test_parallel_coordinates.py Projet : pared/dvc

def test_scalar_columns():
    td = TabularData(["col-1", "col-2", "col-3"])
    td.extend([["0.1", "1", ""], ["2", "0.2", "0"]])
    renderer = ParallelCoordinatesRenderer(td)

    result = json.loads(renderer.as_json())

    assert expected_format(result)

    assert result["data"][0]["dimensions"][0] == {
        "label": "col-1",
        "values": [0.1, 2.0],
    }
    assert result["data"][0]["dimensions"][1] == {
        "label": "col-2",
        "values": [1.0, 0.2],
    }
    assert result["data"][0]["dimensions"][2] == {
        "label": "col-3",
        "values": [None, 0],
    }

Exemple #14

0

Afficher le fichier

Fichier : test_tabular_data.py Projet : ush98/dvc

def test_dict_like_interfaces():
    td = TabularData(["col-1", "col-2"])

    td.extend([["foo", "bar"], ["foobar", "foobar"]])
    assert td.keys() == ["col-1", "col-2"]
    assert dict(td.items()) == {
        "col-1": ["foo", "foobar"],
        "col-2": ["bar", "foobar"],
    }
    assert td.as_dict() == [
        {"col-1": "foo", "col-2": "bar"},
        {"col-1": "foobar", "col-2": "foobar"},
    ]
    assert td.as_dict(["col-1"]) == [{"col-1": "foo"}, {"col-1": "foobar"}]

Exemple #15

0

Afficher le fichier

def test_drop_duplicates_subset(axis, subset, expected):
    td = TabularData(["col-1", "col-2", "col-3", "col-4"])
    td.extend([
        ["foo", "foo", "foo", "bar"],
        ["foo", "bar", "foo", "bar"],
        ["foo", "bar", "foobar", "bar"],
    ])
    assert list(td) == [
        ["foo", "foo", "foo", "bar"],
        ["foo", "bar", "foo", "bar"],
        ["foo", "bar", "foobar", "bar"],
    ]
    td.drop_duplicates(axis, subset=subset)
    assert list(td) == expected

Exemple #16

0

Afficher le fichier

def test_to_parallel_coordinates(tmp_dir, mocker):
    (tmp_dir / "foo").mkdir()
    td = TabularData(["categorical", "scalar"])
    td.extend([["foo", "0.1"], ["bar", "2"]])

    write = mocker.patch("dvc_render.html.render_html")
    renderer_class = mocker.patch(
        "dvc_render.plotly.ParallelCoordinatesRenderer"
    )
    renderer = renderer_class.return_value

    td.to_parallel_coordinates(output_path="foo")

    renderer_class.assert_called_with(
        td.as_dict(), color_by=None, fill_value=td._fill_value
    )

    write.assert_called_with(renderers=[renderer], output_file="foo")

Exemple #17

0

Afficher le fichier

def test_drop_duplicates(axis, expected):
    td = TabularData(["col-1", "col-2", "col-3"])
    td.extend([["foo"], ["foo", "foo"], ["foo", "foo"],
               ["foo", "bar", "foobar"]])

    assert list(td) == [
        ["foo", "", ""],
        ["foo", "foo", ""],
        ["foo", "foo", ""],
        ["foo", "bar", "foobar"],
    ]

    td.drop_duplicates(axis)

    assert list(td) == expected

Exemple #18

0

Afficher le fichier

def test_drop_duplicates(axis, expected, ignore_empty):
    td = TabularData(["col-1", "col-2", "col-3"], fill_value="-")
    td.extend([["foo"], ["foo", "foo"], ["foo", "foo"],
               ["foo", "bar", "foobar"]])

    assert list(td) == [
        ["foo", "-", "-"],
        ["foo", "foo", "-"],
        ["foo", "foo", "-"],
        ["foo", "bar", "foobar"],
    ]

    td.drop_duplicates(axis, ignore_empty=ignore_empty)

    assert list(td) == expected

Exemple #19

0

Afficher le fichier

def test_drop_duplicates_ignore_empty():
    td = TabularData(["col-1", "col-2", "col-3"], fill_value="-")
    td.extend([["foo"], ["foo", "foo"], ["foo", "foo"],
               ["foo", "bar", "foobar"]])

    assert list(td) == [
        ["foo", "-", "-"],
        ["foo", "foo", "-"],
        ["foo", "foo", "-"],
        ["foo", "bar", "foobar"],
    ]

    td.drop_duplicates("cols", ignore_empty=False)

    assert list(td) == [
        ["-", "-"],
        ["foo", "-"],
        ["foo", "-"],
        ["bar", "foobar"],
    ]

Exemple #20

0

Afficher le fichier

def test_drop_duplicates_rich_text():
    from dvc.ui import ui

    td = TabularData(["col-1", "col-2", "col-3"], fill_value="-")

    td.extend([
        ["foo", None, ui.rich_text("-")],
        ["foo", "foo"],
        ["foo", "foo"],
        ["foo", "bar", "foobar"],
    ])

    assert list(td) == [
        ["foo", "-", ui.rich_text("-")],
        ["foo", "foo", "-"],
        ["foo", "foo", "-"],
        ["foo", "bar", "foobar"],
    ]

    td.drop_duplicates("cols")

    assert list(td) == [["-"], ["foo"], ["foo"], ["bar"]]

Exemple #21

0

Afficher le fichier

Fichier : machine.py Projet : pared/dvc

    def run(self):
        if self.repo.machine is None:
            raise MachineDisabledError

        td = TabularData(self.INSTANCE_FIELD + self.SHOWN_FIELD,
                         fill_value=self.FILL_VALUE)

        if self.args.name:
            all_status = list(self.repo.machine.status(self.args.name))
            self._add_row(self.args.name, all_status, td)
        else:
            name_set = set()
            for level in self.repo.config.LEVELS:
                conf = self.repo.config.read(level)["machine"]
                name_set.update(conf.keys())
            name_list = list(name_set)
            for name in sorted(name_list):
                all_status = list(self.repo.machine.status(name))
                self._add_row(name, all_status, td)

        td.dropna("cols", "all")
        td.render()
        return 0

Exemple #22

0

Afficher le fichier

def test_drop_duplicates_invalid_axis():
    td = TabularData(["col-1", "col-2", "col-3"])

    with pytest.raises(ValueError, match="Invalid 'axis' value foo."):
        td.drop_duplicates("foo")

Exemple #23

0

Afficher le fichier

def test_protected():
    td = TabularData(["col1", "col2", "col3", "other"])
    td.append(["foo", "bar", "baz", "other_val"])
    td.protect("col1", "col2")

    td.drop("col1", "col2", "col3", "other")
    assert td.keys() == ["col1", "col2"]
    assert list(td) == [["foo", "bar"]]

    td.unprotect("col2")

    td.drop("col1", "col2")
    assert td.keys() == ["col1"]
    assert list(td) == [["foo"]]

Exemple #24

0

Afficher le fichier

def test_dropna(axis, how, data, expected):
    td = TabularData(["col-1", "col-2", "col-3"])
    td.extend(data)
    td.dropna(axis, how)
    assert list(td) == expected

Exemple #25

0

Afficher le fichier

Fichier : test_tabular_data.py Projet : ush98/dvc

def test_table_empty(capsys):
    td = TabularData(["Col1", "Col2", "Col3"])
    assert dict(td.items()) == {"Col1": [], "Col2": [], "Col3": []}
    assert td.columns == [[], [], []]
    assert td.keys() == ["Col1", "Col2", "Col3"]
    assert list(td) == []
    assert td.Col1 == []
    assert td.Col2 == []
    assert td.Col3 == []

    assert td[1:] == []
    with pytest.raises(IndexError):
        _ = td[1]

    assert len(td) == 0
    assert td.shape == (3, 0)
    assert td.to_csv() == """Col1,Col2,Col3\r\n"""

    td.render()
    assert capsys.readouterr() == ("", "")

    td.render(rich_table=True)
    assert capsys.readouterr() == ("", "")

    td.render(markdown=True)
    assert capsys.readouterr() == (
        "| Col1   | Col2   | Col3   |\n|--------|--------|--------|\n\n",
        "",
    )

    td.rename("Col1", "Col11")
    assert td.keys() == ["Col11", "Col2", "Col3"]

    td.project("Col3", "Col11")
    assert td.keys() == ["Col3", "Col11"]

Exemple #26

0

Afficher le fichier

def test_dropna_subset(axis, expected):
    td = TabularData(["col-1", "col-2", "col-3"])
    td.extend([["foo"], ["foo", "bar"], ["foo", "bar", "foobar"]])
    td.dropna(axis, subset=["col-1", "col-2"])
    assert list(td) == expected

Exemple #27

0

Afficher le fichier

Fichier : test_tabular_data.py Projet : ush98/dvc

def test_fill_value():
    td = TabularData(["col-1", "col-2", "col-3"], fill_value="?")
    td.append(["foo"])
    assert list(td) == [["foo", "?", "?"]]

    td.extend(
        [
            ["bar"],
            ["foobar", "foobar2"],
            ["f", "fo", "foo", "foob", "fooba", "foobar"],
        ]
    )
    assert list(td) == [
        ["foo", "?", "?"],
        ["bar", "?", "?"],
        ["foobar", "foobar2", "?"],
        ["f", "fo", "foo"],
    ]

    td.insert(1, ["lorem"])
    assert td[1] == ["lorem", "?", "?"]

    td[0] = ["lorem", "ipsum"]
    assert td[0] == ["lorem", "ipsum", "?"]

    td[1:2] = [["f", "fo"]]
    assert td[1:2] == [["f", "fo", "?"]]

    td.add_column("col-4")
    assert td.keys() == ["col-1", "col-2", "col-3", "col-4"]
    assert td[0][3] == "?"