Python DatasetManager.get_datasets 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: dataset_manager

클래스/타입: DatasetManager

메소드/함수: get_datasets

hotexamples.com에서의 예제들: 6

Python DatasetManager.get_datasets - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 dataset_manager.DatasetManager.get_datasets에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

DatasetManager(27)

get_datasets(6)

boot(5)

create_dataset(3)

generate_3d_data_for_prefix_length(3)

get_batch(2)

encode_data_with_label_all_data(2)

equalize_vector_length_to_np(2)

generate_3d_data_with_label_all_data(2)

add_array(2)

generate_3d_data(2)

get_dataset(2)

get_max_case_length(1)

get_pos_case_length_quantile(1)

get_dataset_names(1)

generate_3d_data_for_prefix_length_with_label_all_data(1)

get_dataloader(1)

extract_timestamp_features(1)

generate_3d_data_for_prefix_length_with_label(1)

generate_3d_data_for_prefix_length_no_padding(1)

extract_duration_features(1)

encode_data_with_label_all_data_act_res_embedding(1)

encode_data_with_label(1)

encode_data(1)

create_label_vector(1)

create_dataset_with_new_annotations(1)

convert_labels_to_np(1)

calculate_divisors(1)

get_test_by_batch(1)

예제 #1

파일 보기

파일: test_manager.py 프로젝트: dmvieira/dataset-manager

    def test_should_read_yaml_from_dir(self):

        expected = {
            "one_test": {
                "source": "http://source/teste",
                "description": "my little dataset"
            }
        }

        data = DatasetManager("./tests/resources/one_data")
        self.assertDictEqual(data.get_datasets(), expected)

예제 #2

파일 보기

파일: test_printer.py 프로젝트: dmvieira/dataset-manager

    def test_should_print_ascii(self):
        self.maxDiff = None
        result = """+---------------------+------------+-----------------------------------------------------------------------------+
|     description     | identifier |                                    source                                   |
+---------------------+------------+-----------------------------------------------------------------------------+
|  my little dataset  |  one_test  | https://raw.githubusercontent.com/pcsanwald/kaggle-titanic/master/train.csv |
| my little dataset 2 |  two_test  | https://raw.githubusercontent.com/pcsanwald/kaggle-titanic/master/train.csv |
+---------------------+------------+-----------------------------------------------------------------------------+"""
        data = DatasetManager("./tests/resources/multiple_data")
        printer = Printer(data.get_datasets())
        self.assertEqual(result, printer.__repr__())

예제 #3

파일 보기

파일: test_manager.py 프로젝트: dmvieira/dataset-manager

    def test_should_create_dataset_with_custom_data(self):
        data = DatasetManager(self.trash_dir, fs=self.os)
        identifier = "data_name_custom"
        dataset = {
            "identifier": identifier,
            "description": "description",
            "source": "/tmp/test.csv"
        }
        data.create_dataset(**dataset)
        self.assertTrue(
            self.os.isfile("{}/{}.yaml".format(self.trash_dir, identifier)))

        self.assertEqual(len(os.listdir(self.trash_dir)), 2)
        loaded_dataset = data.get_datasets()
        self.assertEqual(list(loaded_dataset.keys()), [identifier])

        datasource_configs = loaded_dataset.get(identifier)
        self.assertEqual(datasource_configs["description"],
                         dataset["description"])
        self.assertEqual(datasource_configs["source"], dataset["source"])

예제 #4

파일 보기

파일: test_manager.py 프로젝트: dmvieira/dataset-manager

    def test_should_read_multiple_yaml_from_dir(self):

        expected = {
            "one_test": {
                "source":
                "https://raw.githubusercontent.com/pcsanwald/kaggle-titanic/master/train.csv",
                "description": "my little dataset"
            },
            "two_test": {
                "source":
                "https://raw.githubusercontent.com/pcsanwald/kaggle-titanic/master/train.csv",
                "description": "my little dataset 2"
            }
        }

        data = DatasetManager("./tests/resources/multiple_data", fs=self.os)
        result = list(data.get_datasets().keys())
        result.sort()
        expected = ["one_test", "two_test"]
        self.assertListEqual(expected, result)

예제 #5

파일 보기

파일: test_manager.py 프로젝트: dmvieira/dataset-manager

    def test_should_create_dataset(self):
        data = DatasetManager(self.trash_dir, fs=self.os)
        identifier = "data_name"
        dataset = {
            "identifier": identifier,
            "description": "description",
            "source": "/tmp/test.csv",
        }

        data.create_dataset(**dataset)

        loaded_datasets = data.get_datasets()
        dataset_config = loaded_datasets.get(identifier)

        self.assertTrue(
            self.os.isfile("{}/{}.yaml".format(self.trash_dir, identifier)))
        self.assertEqual(len(self.os.listdir(self.trash_dir)), 2)

        self.assertEqual(list(loaded_datasets.keys())[0], identifier)
        self.assertEqual(dataset_config.get("description"),
                         dataset["description"])
        self.assertEqual(dataset_config.get("source"), dataset["source"])

예제 #6

파일 보기

파일: test_printer.py 프로젝트: dmvieira/dataset-manager

    def test_should_print_html(self):
        self.maxDiff = None
        result = """<table>
    <tr>
        <th>description</th>
        <th>identifier</th>
        <th>source</th>
    </tr>
    <tr>
        <td>my little dataset</td>
        <td>one_test</td>
        <td>https://raw.githubusercontent.com/pcsanwald/kaggle-titanic/master/train.csv</td>
    </tr>
    <tr>
        <td>my little dataset 2</td>
        <td>two_test</td>
        <td>https://raw.githubusercontent.com/pcsanwald/kaggle-titanic/master/train.csv</td>
    </tr>
</table>"""
        data = DatasetManager("./tests/resources/multiple_data")
        printer = Printer(data.get_datasets())
        self.assertEqual(result, printer._repr_html_())