Python RandomSoftPolicy示例

编程语言: Python

命名空间/包名称: behavior_regularized_offline_rl.brac.policies

方法/功能: RandomSoftPolicy

hotexamples.com的示例: 2

Python RandomSoftPolicy - 已找到2个示例。这些是从开源项目中提取的最受好评的behavior_regularized_offline_rl.brac.policies.RandomSoftPolicy现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

def wrap_policy(a_net, wrapper):
    """Wraps actor network with desired randomization."""
    if wrapper[0] == 'none':
        policy = policies.RandomSoftPolicy(a_net)
    elif wrapper[0] == 'eps':
        policy = policies.EpsilonGreedyRandomSoftPolicy(a_net, wrapper[1])
    elif wrapper[0] == 'gaussian':
        policy = policies.GaussianRandomSoftPolicy(a_net, std=wrapper[1])
    elif wrapper[0] == 'gaussianeps':
        policy = policies.GaussianEpsilonGreedySoftPolicy(a_net,
                                                          std=wrapper[1],
                                                          eps=wrapper[2])
    return policy

示例#2

显示文件

文件： bc_agent.py 项目： shih29242890/AI_google-research

 def _build_online_policy(self):
   return policies.RandomSoftPolicy(
       a_network=self._agent_module.p_net,
       )