Ejemplos de VcUsage en Python, ejemplos de watchdog.VcUsage en Python

Ejemplo n.º 1

0

Mostrar archivo

    def test_process_unscheduled_pods(self):
        objs = json.loads(
            self.get_data_test_input("data/dlts_unscheduled_pods.json"))

        pod_gauge = watchdog.gen_k8s_pod_gauge()
        container_gauge = watchdog.gen_k8s_container_gauge()
        pods_info = collections.defaultdict(lambda: [])

        vc_usage = watchdog.VcUsage()

        for obj in objs:
            watchdog.parse_pod_item(obj, pod_gauge, container_gauge, pods_info,
                                    [], vc_usage)

        self.assertEqual(1, len(pods_info))
        self.assertEqual(2, len(pods_info["unscheduled"]))

        cluster_gpu_info = watchdog.ClusterGPUInfo()
        cluster_gpu_info.available = 10
        cluster_gpu_info.preemptable_available = 10

        watchdog.process_unscheduled_pods(pods_info, cluster_gpu_info)

        self.assertEqual(9, cluster_gpu_info.available)
        self.assertEqual(8, cluster_gpu_info.preemptable_available)

Ejemplo n.º 2

0

Mostrar archivo

Archivo: test_watchdog.py Proyecto: ziplex/DLWorkspace

    def test_process_pods_with_vc_usage(self):
        obj = json.loads(
            self.get_data_test_input("data/dlts_non_preemptable_pod.json"))

        pod_gauge = watchdog.gen_pai_pod_gauge()
        container_gauge = watchdog.gen_pai_container_gauge()
        pod_info = collections.defaultdict(lambda: [])

        vc_usage = watchdog.VcUsage()

        watchdog.parse_pod_item(obj, pod_gauge, container_gauge, pod_info, [],
                                vc_usage)

        self.assertEqual(1, len(vc_usage.map))
        self.assertEqual(1, len(vc_usage.map["some_vc_name"]))
        self.assertEqual(1, vc_usage.map["some_vc_name"]["P40"][0])
        self.assertEqual(1, vc_usage.map["some_vc_name"]["P40"][1])

        obj = json.loads(
            self.get_data_test_input("data/dlts_preemptable_pod.json"))
        watchdog.parse_pod_item(obj, pod_gauge, container_gauge, pod_info, [],
                                vc_usage)

        self.assertEqual(1, len(vc_usage.map))
        self.assertEqual(2, len(vc_usage.map["some_vc_name"]))
        # P40 do not change since preemptable pod using P80
        self.assertEqual(1, vc_usage.map["some_vc_name"]["P40"][0])
        self.assertEqual(1, vc_usage.map["some_vc_name"]["P40"][1])

        self.assertEqual(1, vc_usage.map["some_vc_name"]["P80"][0])
        self.assertEqual(0, vc_usage.map["some_vc_name"]["P80"][1])

Ejemplo n.º 3

0

Mostrar archivo

    def test_parse_monitor_response_time(self):
        obj = json.loads(
            self.get_data_test_input(
                "data/pods_with_response_time_monitor.json"))

        pod_gauge = watchdog.gen_k8s_pod_gauge()
        container_gauge = watchdog.gen_k8s_container_gauge()
        pod_info = collections.defaultdict(lambda: [])

        endpoints = []

        vc_usage = watchdog.VcUsage()

        watchdog.process_pods_status(obj, pod_gauge, container_gauge, pod_info,
                                     endpoints, vc_usage)

        self.assertEqual(2, len(endpoints))
        endpoint0 = endpoints[0]
        endpoint1 = endpoints[1]

        self.assertEqual("job-exporter", endpoint0.name)
        self.assertEqual("job-exporter", endpoint1.name)

        self.assertEqual("10.151.40.231", endpoint0.ip)
        self.assertEqual("10.151.40.227", endpoint1.ip)

        self.assertEqual(9102, endpoint0.port)
        self.assertEqual(9102, endpoint1.port)

        self.assertEqual("/healthz", endpoint0.path)
        self.assertEqual("/healthz", endpoint1.path)

        self.assertEqual(10, endpoint0.timeout)
        self.assertEqual(10, endpoint1.timeout)

Ejemplo n.º 4

0

Mostrar archivo

            def collect(self):
                pod_gauge = watchdog.gen_k8s_pod_gauge()
                container_gauge = watchdog.gen_k8s_container_gauge()
                pod_info = collections.defaultdict(lambda: [])

                watchdog.process_pods_status(obj, pod_gauge, container_gauge,
                                             pod_info, [], watchdog.VcUsage())

                yield pod_gauge
                yield container_gauge

Ejemplo n.º 5

0

Mostrar archivo

    def test_process_pods_with_no_condition(self):
        obj = json.loads(self.get_data_test_input("data/no_condtion_pod.json"))

        pod_gauge = watchdog.gen_k8s_pod_gauge()
        container_gauge = watchdog.gen_k8s_container_gauge()
        pod_info = collections.defaultdict(lambda: [])

        watchdog.process_pods_status(obj, pod_gauge, container_gauge, pod_info,
                                     [], watchdog.VcUsage())

        self.assertTrue(len(pod_gauge.samples) > 0)
        self.assertEqual(0, len(container_gauge.samples))

Ejemplo n.º 6

0

Mostrar archivo

Archivo: test_watchdog.py Proyecto: ziplex/DLWorkspace

    def test_parse_pods_status(self):
        obj = json.loads(self.get_data_test_input("data/pods_list.json"))

        pod_gauge = watchdog.gen_pai_pod_gauge()
        container_gauge = watchdog.gen_pai_container_gauge()
        pod_info = collections.defaultdict(lambda: [])

        watchdog.process_pods_status(obj, pod_gauge, container_gauge, pod_info,
                                     [], watchdog.VcUsage())

        self.assertTrue(len(pod_gauge.samples) > 0)
        self.assertTrue(len(container_gauge.samples) > 0)

Ejemplo n.º 7

0

Mostrar archivo

    def test_gpu_accounting(self):
        vc_info = {"A": {"P40": 40}, "B": {"P40": 40}, "C": {"P40": 40}}

        vc_usage = watchdog.VcUsage()

        vc_usage.add_used("A", "P40", 40)
        vc_usage.add_used("B", "P40", 31)
        vc_usage.add_used("C", "P40", 0)

        cluster_gpu_info = watchdog.ClusterGPUInfo()
        cluster_gpu_info.capacity = 120
        cluster_gpu_info.available = 29
        cluster_gpu_info.allocatable = 100
        vc_total, vc_avail, vc_preemptive_avail, vc_unschedulable_gauge = \
                watchdog.gen_vc_metrics(vc_info, vc_usage, cluster_gpu_info)

        self.assertEqual(3, len(vc_total.samples))
        for sample in vc_total.samples:
            vc_name = sample.labels["vc_name"]
            gpu_type = sample.labels["gpu_type"]
            self.assertEqual(vc_info[vc_name][gpu_type], sample.value)

        target_vc_avail = {"A": {"P40": 0}, "B": {"P40": 1}, "C": {"P40": 27}}

        self.assertEqual(3, len(vc_avail.samples))
        for sample in vc_avail.samples:
            vc_name = sample.labels["vc_name"]
            gpu_type = sample.labels["gpu_type"]
            self.assertEqual(target_vc_avail[vc_name][gpu_type], sample.value,
                             "vc " + vc_name + ", gpu " + gpu_type)

        target_vc_preemptive_avail = {
            "A": {
                "P40": 29
            },
            "B": {
                "P40": 29
            },
            "C": {
                "P40": 29
            }
        }

        self.assertEqual(3, len(vc_preemptive_avail.samples))
        for sample in vc_preemptive_avail.samples:
            vc_name = sample.labels["vc_name"]
            gpu_type = sample.labels["gpu_type"]
            self.assertEqual(target_vc_preemptive_avail[vc_name][gpu_type],
                             sample.value, "vc " + vc_name)

        target_vc_unschedulable = {
            "A": {
                "P40": 0
            },
            "B": {
                "P40": 8
            },
            "C": {
                "P40": 13
            }
        }
        self.assertEqual(3, len(vc_unschedulable_gauge.samples))
        for sample in vc_unschedulable_gauge.samples:
            vc_name = sample.labels["vc_name"]
            gpu_type = sample.labels["gpu_type"]
            self.assertEqual(target_vc_unschedulable[vc_name][gpu_type],
                             sample.value, "vc " + vc_name)

Ejemplo n.º 8

0

Mostrar archivo

    def test_process_vc_info(self):
        vc_info = {
            "default": {
                "P40": 10,
                "P80": 10
            },
            "platform": {
                "P40": 10
            },
            "relevance": {
                "P80": 4
            }
        }

        vc_usage = watchdog.VcUsage()

        vc_usage.add_preemptable_used("default", "P40", 8)
        vc_usage.add_preemptable_used("default", "P80", 2)
        vc_usage.add_used("default", "P40", 2)

        vc_usage.add_used("platform", "P40", 3)

        cluster_gpu_info = watchdog.ClusterGPUInfo()
        cluster_gpu_info.capacity = 34
        cluster_gpu_info.available = 29
        cluster_gpu_info.allocatable = 34
        vc_total, vc_avail, vc_preemptive_avail, vc_unschedulable_gauge = \
                watchdog.gen_vc_metrics(vc_info, vc_usage, cluster_gpu_info)

        self.assertEqual(4, len(vc_total.samples))
        for sample in vc_total.samples:
            vc_name = sample.labels["vc_name"]
            gpu_type = sample.labels["gpu_type"]
            self.assertEqual(vc_info[vc_name][gpu_type], sample.value)

        target_vc_avail = {
            "default": {
                "P40": 8,
                "P80": 10
            },
            "platform": {
                "P40": 7
            },
            "relevance": {
                "P80": 4
            }
        }

        self.assertEqual(4, len(vc_avail.samples))
        for sample in vc_avail.samples:
            vc_name = sample.labels["vc_name"]
            gpu_type = sample.labels["gpu_type"]
            self.assertEqual(target_vc_avail[vc_name][gpu_type], sample.value,
                             "vc " + vc_name + ", gpu " + gpu_type)

        target_vc_preemptive_avail = {
            "default": {
                "P40": 29,
                "P80": 29
            },
            "platform": {
                "P40": 29
            },
            "relevance": {
                "P80": 29
            }
        }

        self.assertEqual(4, len(vc_preemptive_avail.samples))
        for sample in vc_preemptive_avail.samples:
            vc_name = sample.labels["vc_name"]
            gpu_type = sample.labels["gpu_type"]
            self.assertEqual(target_vc_preemptive_avail[vc_name][gpu_type],
                             sample.value, "vc " + vc_name)

        target_vc_unschedulable = {
            "default": {
                "P40": 0,
                "P80": 0
            },
            "platform": {
                "P40": 0
            },
            "relevance": {
                "P80": 0
            }
        }
        for sample in vc_unschedulable_gauge.samples:
            vc_name = sample.labels["vc_name"]
            gpu_type = sample.labels["gpu_type"]
            self.assertEqual(target_vc_unschedulable[vc_name][gpu_type],
                             sample.value,
                             "vc " + vc_name + ", gpu " + gpu_type)

Ejemplo n.º 9

0

Mostrar archivo

    def test_process_vc_info_real_case(self):
        vc_info = {
            "quantus": {
                "P40": 150
            },
            "relevance2": {
                "P40": 234
            },
            "relevance2-inf": {
                "P40": 40
            }
        }

        vc_usage = watchdog.VcUsage()

        vc_usage.add_preemptable_used("relevance2", "P40", 24)
        vc_usage.add_used("relevance2", "P40", 231)
        vc_usage.add_used("quantus", "P40", 125)

        cluster_gpu_info = watchdog.ClusterGPUInfo()
        cluster_gpu_info.capacity = 424
        cluster_gpu_info.available = 68
        cluster_gpu_info.allocatable = 423
        vc_total, vc_avail, vc_preemptive_avail, vc_unschedulable_gauge = \
                watchdog.gen_vc_metrics(vc_info, vc_usage, cluster_gpu_info)

        self.assertEqual(3, len(vc_total.samples))
        for sample in vc_total.samples:
            vc_name = sample.labels["vc_name"]
            gpu_type = sample.labels["gpu_type"]
            self.assertEqual(vc_info[vc_name][gpu_type], sample.value)

        target_vc_avail = {
            "quantus": {
                "P40": 25
            },
            "relevance2": {
                "P40": 2
            },
            "relevance2-inf": {
                "P40": 40
            }
        }

        self.assertEqual(3, len(vc_avail.samples))
        for sample in vc_avail.samples:
            vc_name = sample.labels["vc_name"]
            gpu_type = sample.labels["gpu_type"]
            self.assertEqual(target_vc_avail[vc_name][gpu_type], sample.value,
                             "vc " + vc_name + ", gpu " + gpu_type)

        target_vc_preemptive_avail = {
            "quantus": {
                "P40": 68
            },
            "relevance2": {
                "P40": 68
            },
            "relevance2-inf": {
                "P40": 68
            }
        }

        self.assertEqual(3, len(vc_preemptive_avail.samples))
        for sample in vc_preemptive_avail.samples:
            vc_name = sample.labels["vc_name"]
            gpu_type = sample.labels["gpu_type"]
            self.assertEqual(target_vc_preemptive_avail[vc_name][gpu_type],
                             sample.value, "vc " + vc_name)

        target_vc_unschedulable = {
            "quantus": {
                "P40": 0
            },
            "relevance2": {
                "P40": 1
            },
            "relevance2-inf": {
                "P40": 0
            }
        }
        self.assertEqual(3, len(vc_unschedulable_gauge.samples))
        for sample in vc_unschedulable_gauge.samples:
            vc_name = sample.labels["vc_name"]
            gpu_type = sample.labels["gpu_type"]
            self.assertEqual(target_vc_unschedulable[vc_name][gpu_type],
                             sample.value,
                             "vc " + vc_name + ", gpu " + gpu_type)