Python VPG_tの例

プログラミング言語: Python

名前空間/パッケージ名: Algo.vpg_transfer_multimaze

クラス/型: VPG_t

hotexamples.comのコード掲載数: 1

Python VPG_t - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのAlgo.vpg_transfer_multimaze.VPG_tの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

VPG_t(2)

train(1)

よく使われるメソッド

VPG_t (2)

train (1)

コード例 #1

ファイルを表示

from Algo import parallel_sampler
parallel_sampler.initialize(n_parallel=1)
parallel_sampler.set_seed(0)

policy = QMDPPolicy(env_spec=env.spec,
                    name="QMDP",
                    qmdp_param=env._wrapped_env.params)

baseline = LinearFeatureBaseline(env_spec=env.spec)

with tf.Session() as sess:

    algo = VPG_t(
        env=env,
        policy=policy,
        baseline=baseline,
        batch_size=2048,
        max_path_length=env._wrapped_env.params['traj_limit'],
        n_itr=20000,
        discount=0.95,
        step_size=0.01,
        record_rewards=True,
        transfer=False,
        env_path=log_dir + '/TrainEnv',
        env_num=500,
        env_keep_itr=10,
    )

    algo.train(sess)