Python get_shard_id2num_examples Beispiele

Programmiersprache: Python

Namespace / Paketname: tensorflow_datasets.core.splits

Methode / Funktion: get_shard_id2num_examples

Beispiele auf hotexamples.com: 2

Python get_shard_id2num_examples - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die tensorflow_datasets.core.splits.get_shard_id2num_examples, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Beispiel #1

Datei anzeigen

Datei: splits_test.py Projekt: xiaomogui/datasets

 def test_get_shard_id2num_examples(self):
   self.assertEqual(
       splits.get_shard_id2num_examples(num_shards=8, total_num_examples=80),
       [10, 10, 10, 10, 10, 10, 10, 10],
   )
   self.assertEqual(
       splits.get_shard_id2num_examples(num_shards=5, total_num_examples=553),
       [111, 111, 111, 110, 110],
   )

Beispiel #2

Datei anzeigen

    def _slice_split_info_to_instruction_dicts(self, list_sliced_split_info):
        """Return the list of files and reading mask of the files to read."""
        instruction_dicts = []
        for sliced_split_info in list_sliced_split_info:
            mask = splits_lib.slice_to_percent_mask(
                sliced_split_info.slice_value)

            # Compute filenames from the given split
            filepaths = list(
                sorted(
                    self._build_split_filenames(sliced_split_info.split_info)))

            # Compute the offsets
            if sliced_split_info.split_info.num_examples:
                shard_id2num_examples = splits_lib.get_shard_id2num_examples(
                    sliced_split_info.split_info.num_shards,
                    sliced_split_info.split_info.num_examples,
                )
                mask_offsets = splits_lib.compute_mask_offsets(
                    shard_id2num_examples)
            else:
                logging.warning(
                    "Statistics not present in the dataset. TFDS is not able to load "
                    "the total number of examples, so using the subsplit API may not "
                    "provide precise subsplits.")
                mask_offsets = [0] * len(filepaths)

            for filepath, mask_offset in zip(filepaths, mask_offsets):
                instruction_dicts.append({
                    "filepath": filepath,
                    "mask": mask,
                    "mask_offset": mask_offset,
                })
        return instruction_dicts