Python _collect_states_on_rank_zero_over_collection示例

编程语言: Python

命名空间/包名称: pytorch_lightning.utilities.auto_restart

方法/功能: _collect_states_on_rank_zero_over_collection

hotexamples.com的示例: 4

Python _collect_states_on_rank_zero_over_collection - 已找到4个示例。这些是从开源项目中提取的最受好评的pytorch_lightning.utilities.auto_restart._collect_states_on_rank_zero_over_collection现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： evaluation_epoch_loop.py 项目： neptune-ai/pytorch-lightning

    def on_save_checkpoint(self) -> Dict:
        state_dict = super().on_save_checkpoint()

        if (
            self.trainer is not None
            and self.trainer.state._fault_tolerant_mode.is_enabled
            and self._data_fetcher is not None
            and not self._num_completed_batches_reached()  # did not finish
            and self.batch_progress.current.ready  # did start
        ):
            state = CombinedLoader._state_dict_fn(self._data_fetcher.dataloader_iter, self._has_completed())
            if state:
                state_dict["dataloader_state_dict"] = _collect_states_on_rank_zero_over_collection(state)

        return state_dict

示例#2

显示文件

文件： training_epoch_loop.py 项目： wandb/pytorch-lightning

    def on_save_checkpoint(self) -> Dict:
        state_dict = super().on_save_checkpoint()

        if (self.trainer.train_dataloader is None
                or self._num_completed_batches_reached()  # did not finish
                # TODO: fault-tolerance requires a minimum number of batches so probably should be > 0
                or self.batch_progress.current.ready == 0  # did not start
            ):
            return state_dict

        state_dict[
            "dataloader_state_dict"] = _collect_states_on_rank_zero_over_collection(
                self.trainer.train_dataloader.state_dict(
                    has_completed=self._has_completed()))
        return state_dict

示例#3

显示文件

文件： evaluation_epoch_loop.py 项目： ricklentz/pytorch-lightning

    def on_save_checkpoint(self) -> Dict:
        state_dict = super().on_save_checkpoint()

        if (
            self._data_fetcher is None
            or self._num_completed_batches_reached()  # did not finish
            # TODO: fault-tolerance requires a minimum number of batches so probably should be > 0
            or self.batch_progress.current.ready == 0  # did not start
        ):
            return state_dict

        # TODO: this should use `pytorch_lightning/trainer/supporters.py::CombinedLoader._state_dict_fn`
        state_to_save = "state" if self._has_completed() else "previous_state"
        state: Optional[MergedIteratorState] = getattr(self._data_fetcher.dataloader_iter, state_to_save, None)
        if state:
            state_dict["dataloader_state_dict"] = _collect_states_on_rank_zero_over_collection(asdict(state))
        return state_dict

示例#4

显示文件

文件： training_epoch_loop.py 项目： neptune-ai/pytorch-lightning

    def on_save_checkpoint(self) -> Dict:
        state_dict = super().on_save_checkpoint()

        if (self.trainer is not None
                and self.trainer.state._fault_tolerant_mode.is_enabled
                and self.trainer.train_dataloader is not None
                and not self._num_completed_batches_reached()  # did not finish
                # TODO: fault-tolerance requires a minimum number of batches so probably should be > 0
                and self.batch_progress.current.ready  # did start
            ):
            loader: CombinedLoader = self.trainer.train_dataloader
            state = loader.state_dict(has_completed=self._has_completed())
            if state:
                state_dict[
                    "dataloader_state_dict"] = _collect_states_on_rank_zero_over_collection(
                        state)

        return state_dict