Python get_available_datasets示例

编程语言: Python

命名空间/包名称: matminer.datasets.dataset_retrieval

方法/功能: get_available_datasets

hotexamples.com的示例: 6

Python get_available_datasets - 已找到6个示例。这些是从开源项目中提取的最受好评的matminer.datasets.dataset_retrieval.get_available_datasets现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

 def test_print_available_datasets(self):
     # Go over all parameter combinations,
     # for each check that returned dataset is correct
     for sort_method in ['alphabetical', 'num_entries']:
         datasets = get_available_datasets(sort_method=sort_method)
         if sort_method == 'alphabetical':
             self.assertEqual(datasets, sorted(self.dataset_names))
         else:
             self.assertEqual(
                 datasets,
                 sorted(self.dataset_names,
                        key=lambda x: self.dataset_dict[x]['num_entries'],
                        reverse=True))

示例#2

显示文件

文件： test_dataset_retrieval.py 项目： wcreus/matminer

 def test_get_available_datasets(self):
     # Go over all parameter combinations,
     # for each check that returned dataset is correct
     for parameter_combo in product([True, False], [True, False],
                                    ['alphabetical', 'num_entries']):
         datasets = get_available_datasets(*parameter_combo)
         if parameter_combo[2] == 'alphabetical':
             self.assertEqual(datasets, sorted(self.dataset_names))
         else:
             self.assertEqual(
                 datasets,
                 sorted(self.dataset_names,
                        key=lambda x: self.dataset_dict[x]['num_entries'],
                        reverse=True))

示例#3

显示文件

文件： test_dataset_retrieval.py 项目： RamyaGuru/matminer

 def test_get_available_datasets(self):
     # Go over all parameter combinations,
     # for each check that returned dataset is correct
     for parameter_combo in product([True, False], [True, False],
                                    ['alphabetical', 'num_entries']):
         datasets = get_available_datasets(*parameter_combo)
         if parameter_combo[2] == 'alphabetical':
             self.assertEqual(datasets, sorted(self.dataset_names))
         else:
             self.assertEqual(
                 datasets,
                 sorted(self.dataset_names,
                        key=lambda x: self.dataset_dict[x]['num_entries'],
                        reverse=True)
             )

示例#4

显示文件

 def get_available_datasets(self):
     datasets = get_available_datasets()
     return

示例#5

显示文件

from matminer.datasets.dataset_retrieval import load_dataset, get_available_datasets, get_all_dataset_info
datasets = get_available_datasets(print_format=None)

for dataset in datasets:
    if "matbench_" in dataset:
        df = load_dataset(dataset)

        target_col = [col for col in df.columns if col not in ["structure", "composition"]][0]
        print(f"   * - :code:`{dataset}`\n     - :code:`{target_col}`\n     - {df.shape[0]}")


# print(get_all_dataset_info("matbench_steels"))

示例#6

显示文件

文件： core.py 项目： theiman112860/automatminer

            2. composition features are actually desired. (deduced from whether
                composition featurizers are present in self.featurizers).
        Args:
            df (pandas.DataFrame): May or may not contain composition column.

        Returns:
            df (pandas.DataFrame): Contains composition column if desired
        """
        if "structure" in df.columns and "composition" not in df.columns:
            if self.auto_featurizer or (set(_composition_aliases)
                                        & set(self.featurizers.keys())):
                df = self._tidy_column(df, "structure")
                struct2comp = StructureToComposition(
                    target_col_id="composition", overwrite_data=False)
                df = struct2comp.featurize_dataframe(df, "structure")
                self.logger.debug("Adding compositions from structures.")
        return df


if __name__ == "__main__":
    from matminer.datasets.dataset_retrieval import load_dataset, get_available_datasets

    print(get_available_datasets())
    # df = load_dataset("steel_strength").rename(columns={"formula": "composition"})[["yield strength", "composition"]]
    # af = AutoFeaturizer()
    # print(df)
    # df = af.fit_transform(df, "yield strength")

    from pymatgen import Structure
    # s = Structure()
    # s.