Python backward示例

编程语言: Python

命名空间/包名称: pytext.utils.precision

方法/功能: backward

hotexamples.com的示例: 4

Python backward - 已找到4个示例。这些是从开源项目中提取的最受好评的pytext.utils.precision.backward现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： trainer.py 项目： oasis100/pytext

    def backprop(self, state, loss):
        if state.stage != Stage.TRAIN:
            return

        with timing.time("loss.backward"):
            precision.backward(state.optimizer, loss)

        state.scheduler.step_batch()

        if self.config.max_clip_norm is not None:
            grad_norm = precision.clip_grad_norm(state.model, self.optimizer,
                                                 self.config.max_clip_norm)
        else:
            grad_norm = None

        with timing.time("optimizer.step"):
            state.optimizer.step()
        # grad_norm could be used to check grads sync in distributed training
        return grad_norm

示例#2

显示文件

文件： trainer.py 项目： haydenliu/pytext

        def training_backprop(loss):
            with timing.time("loss.backward"):
                precision.backward(self.optimizer, loss)
                if world_size > 1:
                    # DDP fix when some parameters don't receive grads
                    for p in model.parameters():
                        if p.requires_grad and p.grad is None:
                            p.backward(torch.zeros_like(p.data))

            if self.lr_scheduler:
                self.lr_scheduler.step_batch()

            if self.config.max_clip_norm is not None:
                grad_norm = torch.nn.utils.clip_grad_norm_(
                    model.parameters(), self.config.max_clip_norm)
            else:
                grad_norm = None

            with timing.time("optimizer.step"):
                self.optimizer.step()
            # grad_norm could be used to check grads sync in distributed training
            return grad_norm

示例#3

显示文件

    def backprop(self, state, loss):
        if state.stage != Stage.TRAIN:
            return

        with timing.time("loss.backward"):
            precision.backward(state.optimizer, loss)
            if cuda.DISTRIBUTED_WORLD_SIZE > 1:
                # DDP fix when some parameters don't receive grads
                for p in state.model.parameters():
                    if p.requires_grad and p.grad is None:
                        p.backward(torch.zeros_like(p.data))

        state.scheduler.step_batch()

        if self.config.max_clip_norm is not None:
            grad_norm = precision.clip_grad_norm(state.model, self.optimizer,
                                                 self.config.max_clip_norm)
        else:
            grad_norm = None

        with timing.time("optimizer.step"):
            state.optimizer.step()
        # grad_norm could be used to check grads sync in distributed training
        return grad_norm

示例#4

显示文件

文件： trainer.py 项目： LanguageAndIntelligence/pytext

    def backprop(self, state, loss):
        if state.stage != Stage.TRAIN:
            return

        with timing.time("loss.backward"):
            precision.backward(state.optimizer, loss)