Python scale_grad示例

编程语言: Python

命名空间/包名称: chainerrl.functions.scale_grad

方法/功能: scale_grad

hotexamples.com的示例: 2

Python scale_grad - 已找到2个示例。这些是从开源项目中提取的最受好评的chainerrl.functions.scale_grad.scale_grad现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

    def _compute_y_and_t(self, exp_batch):

        batch_state = exp_batch['state']
        batch_size = len(batch_state)

        # Compute Q-values for current states
        qout = self.q_function(batch_state)

        batch_actions = exp_batch['action']
        batch_q = F.reshape(qout.evaluate_actions(batch_actions),
                            (batch_size, 1))

        # Target values must also backprop gradients
        batch_q_target = F.reshape(self._compute_target_values(exp_batch),
                                   (batch_size, 1))

        return batch_q, scale_grad.scale_grad(batch_q_target, self.grad_scale)

示例#2

显示文件

    def _compute_y_and_t(self, exp_batch):

        batch_state = exp_batch['state']

        # Compute Q-values for current states
        if self.recurrent:
            qout, _ = self.model.n_step_forward(batch_state,
                                                exp_batch['recurrent_state'],
                                                output_mode='concat')
        else:
            qout = self.model(batch_state)

        batch_actions = exp_batch['action']
        batch_q = qout.evaluate_actions(batch_actions)[..., None]

        # Target values must also backprop gradients
        batch_q_target = self._compute_target_values(exp_batch)[..., None]

        return batch_q, scale_grad.scale_grad(batch_q_target, self.grad_scale)