Python TransitionExperience示例

编程语言: Python

命名空间/包名称: simulator

hotexamples.com的示例: 2

Python TransitionExperience - 已找到2个示例。这些是从开源项目中提取的最受好评的simulator.TransitionExperience现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

TransitionExperience(2)

示例#1

显示文件

 def cb(outputs):
     try:
         distrib1, distrib2, value1, value2 = outputs.result()
     except CancelledError:
         logger.info("Client {} cancelled.".format(ident))
         return
     assert np.all(np.isfinite(distrib1)), distrib1
     assert np.all(np.isfinite(distrib2)), distrib2
     rand_num = np.random.rand()
     if rand_num < 0.5:
         action = np.random.choice(len(distrib1), p=distrib1)
         updateweight1, updateweight2 = 1.0, 0.0
     else:
         action = np.random.choice(len(distrib2), p=distrib2)
         updateweight2, updateweight1 = 1.0, 0.0
     client = self.clients[ident]
     client.memory.append(
         TransitionExperience(state,
                              action,
                              reward=None,
                              value1=value1,
                              value2=value2,
                              updateweight1=updateweight1,
                              updateweight2=updateweight2,
                              prob1=distrib1[action],
                              prob2=distrib2[action]))
     self.send_queue.put([ident, dumps(action)])

示例#2

显示文件

 def cb(outputs):
     try:
         distrib, value = outputs.result()
     except CancelledError:
         logger.info("Client {} cancelled.".format(client.ident))
         return
     assert np.all(np.isfinite(distrib)), distrib
     action = np.random.choice(len(distrib), p=distrib)
     client.memory.append(TransitionExperience(
         state, action, reward=None, value=value, prob=distrib[action]))
     self.send_queue.put([client.ident, dumps(action)])