Python Policy.update示例

编程语言: Python

命名空间/包名称: policies.policy

类/类型: Policy

方法/功能: update

hotexamples.com的示例: 2

Python Policy.update - 已找到2个示例。这些是从开源项目中提取的最受好评的policies.policy.Policy.update现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

__init__(8)

Policy(4)

to(4)

act(3)

load_state_dict(3)

state_dict(3)

train(2)

update(2)

eval(1)

get_action(1)

get_value(1)

sample(1)

update_observation(1)

示例#1

显示文件

 def update(self, arm, reward):
     """更新收益
     :param reward: 收益
     :type arm: 选中的臂的下标
     """
     Policy.update(self, arm, reward)
     self.b[arm] = self.b[arm] + reward * self.context[arm]
     self.context[arm].shape = (self.d, 1)
     self.A[arm] = self.A[arm] + self.context[arm].dot(np.transpose(self.context[arm]))

示例#2

显示文件

 def update(self, arm, reward):
     Policy.update(self, arm, reward)
     ratio = math.exp(self.gamma * reward /
                      (self.n_bandits * self._probs[arm]))
     # todo 权重会越来越大？
     self._weights[arm] *= ratio