Python DeterministicMLPPolicyの例

プログラミング言語: Python

名前空間/パッケージ名: sandbox.rocky.tf.policies.deterministic_mlp_policy

hotexamples.comのコード掲載数: 1

Python DeterministicMLPPolicy - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのsandbox.rocky.tf.policies.deterministic_mlp_policy.DeterministicMLPPolicyの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

DeterministicMLPPolicy(9)

よく使われるメソッド

DeterministicMLPPolicy (9)

コード例 #1

ファイルを表示

    gymenv = GymEnv(args.env,
                    force_reset=True,
                    record_video=False,
                    record_log=False)
    # gymenv.env.seed(1)
else:
    gymenv = other_env_class_map[args.env]()

#TODO: assert continuous space

env = TfEnv(normalize(gymenv))

policy = DeterministicMLPPolicy(
    env_spec=env.spec,
    name="policy",
    # The neural network policy should have two hidden layers, each with 32 hidden units.
    hidden_sizes=(100, 50, 25),
    hidden_nonlinearity=tf.nn.relu,
)

es = OUStrategy(env_spec=env.spec)

qf = ContinuousMLPQFunction(
    env_spec=env.spec,
    hidden_sizes=(100, 100),
    hidden_nonlinearity=tf.nn.relu,
)

ddpg_type_map = {"regular": DDPG}

ddpg_class = ddpg_type_map[args.type]