Python HfApi.list_datasets示例

编程语言: Python

命名空间/包名称: huggingface_hub.hf_api

类/类型: HfApi

方法/功能: list_datasets

hotexamples.com的示例: 14

Python HfApi.list_datasets - 已找到14个示例。这些是从开源项目中提取的最受好评的huggingface_hub.hf_api.HfApi.list_datasets现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

HfApi(30)

list_models(18)

list_datasets(14)

login(3)

create_repo(2)

delete_repo(2)

list_metrics(2)

model_info(2)

model_list(2)

upload_file(2)

dataset_info(1)

list_repo_files(1)

logout(1)

unset_access_token(1)

示例#1

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_filter_datasets_by_language(self):
     _api = HfApi()
     f = DatasetFilter(languages="en")
     datasets = _api.list_datasets(filter=f)
     self.assertGreater(len(datasets), 0)
     self.assertTrue("languages:en" in datasets[0].tags)
     args = DatasetSearchArguments()
     f = DatasetFilter(languages=(args.languages.en, args.languages.fr))
     datasets = _api.list_datasets(filter=f)
     self.assertGreater(len(datasets), 0)
     self.assertTrue("languages:en" in datasets[0].tags)
     self.assertTrue("languages:fr" in datasets[0].tags)

示例#2

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_filter_datasets_with_cardData(self):
     _api = HfApi()
     datasets = _api.list_datasets(cardData=True)
     self.assertGreater(
         sum([
             getattr(dataset, "cardData", None) is not None
             for dataset in datasets
         ]),
         0,
     )
     datasets = _api.list_datasets()
     self.assertTrue(
         all([
             getattr(dataset, "cardData", None) is None
             for dataset in datasets
         ]))

示例#3

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_list_datasets_full(self):
     _api = HfApi()
     datasets = _api.list_datasets(full=True)
     self.assertGreater(len(datasets), 100)
     dataset = datasets[0]
     self.assertIsInstance(dataset, DatasetInfo)
     self.assertTrue(any(dataset.cardData for dataset in datasets))

示例#4

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_filter_datasets_by_task_ids(self):
     _api = HfApi()
     f = DatasetFilter(task_ids="automatic-speech-recognition")
     datasets = _api.list_datasets(filter=f)
     self.assertGreater(len(datasets), 0)
     self.assertTrue(
         "task_ids:automatic-speech-recognition" in datasets[0].tags)

示例#5

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_filter_datasets_by_task_categories(self):
     _api = HfApi()
     f = DatasetFilter(task_categories="audio-classification")
     datasets = _api.list_datasets(filter=f)
     self.assertGreater(len(datasets), 0)
     self.assertTrue(
         "task_categories:audio-classification" in datasets[0].tags)

示例#6

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_filter_datasets_by_author_and_name(self):
     _api = HfApi()
     f = DatasetFilter(author="huggingface",
                       dataset_name="DataMeasurementsFiles")
     datasets = _api.list_datasets(filter=f)
     self.assertEqual(len(datasets), 1)
     self.assertTrue("huggingface" in datasets[0].author)
     self.assertTrue("DataMeasurementsFiles" in datasets[0].id)

示例#7

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_list_datasets_search(self):
     _api = HfApi()
     datasets = _api.list_datasets(search="wikipedia")
     self.assertGreater(len(datasets), 10)
     self.assertIsInstance(datasets[0], DatasetInfo)

示例#8

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_list_datasets_author(self):
     _api = HfApi()
     datasets = _api.list_datasets(author="huggingface")
     self.assertGreater(len(datasets), 1)
     self.assertIsInstance(datasets[0], DatasetInfo)

示例#9

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_filter_datasets_by_size_categories(self):
     _api = HfApi()
     f = DatasetFilter(size_categories="100K<n<1M")
     datasets = _api.list_datasets(filter=f)
     self.assertGreater(len(datasets), 0)
     self.assertTrue("size_categories:100K<n<1M" in datasets[0].tags)

示例#10

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_filter_datasets_by_multilinguality(self):
     _api = HfApi()
     f = DatasetFilter(multilinguality="yes")
     datasets = _api.list_datasets(filter=f)
     self.assertGreater(len(datasets), 0)
     self.assertTrue("multilinguality:yes" in datasets[0].tags)

示例#11

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_filter_datasets_by_language_creator(self):
     _api = HfApi()
     f = DatasetFilter(language_creators="crowdsourced")
     datasets = _api.list_datasets(filter=f)
     self.assertGreater(len(datasets), 0)
     self.assertTrue("language_creators:crowdsourced" in datasets[0].tags)

示例#12

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_filter_datasets_by_benchmark(self):
     _api = HfApi()
     f = DatasetFilter(benchmark="raft")
     datasets = _api.list_datasets(filter=f)
     self.assertGreater(len(datasets), 0)
     self.assertTrue("benchmark:raft" in datasets[0].tags)

示例#13

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_list_datasets(self):
     _api = HfApi()
     datasets = _api.list_datasets()
     self.assertGreater(len(datasets), 100)
     self.assertIsInstance(datasets[0], DatasetInfo)

示例#14

0

显示文件

文件： test_hf_api.py 项目： LysandreJik/huggingface_hub

 def test_staging_list_datasets(self):
     _api = HfApi(endpoint=ENDPOINT_STAGING)
     _ = _api.list_datasets()