Python RandomSoftPolicyの例

プログラミング言語: Python

名前空間/パッケージ名: behavior_regularized_offline_rl.brac.policies

メソッド/関数: RandomSoftPolicy

hotexamples.comのコード掲載数: 2

Python RandomSoftPolicy - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのbehavior_regularized_offline_rl.brac.policies.RandomSoftPolicyの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

def wrap_policy(a_net, wrapper):
    """Wraps actor network with desired randomization."""
    if wrapper[0] == 'none':
        policy = policies.RandomSoftPolicy(a_net)
    elif wrapper[0] == 'eps':
        policy = policies.EpsilonGreedyRandomSoftPolicy(a_net, wrapper[1])
    elif wrapper[0] == 'gaussian':
        policy = policies.GaussianRandomSoftPolicy(a_net, std=wrapper[1])
    elif wrapper[0] == 'gaussianeps':
        policy = policies.GaussianEpsilonGreedySoftPolicy(a_net,
                                                          std=wrapper[1],
                                                          eps=wrapper[2])
    return policy

コード例 #2

ファイルを表示

ファイル: bc_agent.py プロジェクト: shih29242890/AI_google-research

 def _build_online_policy(self):
   return policies.RandomSoftPolicy(
       a_network=self._agent_module.p_net,
       )