Python CEMの例

プログラミング言語: Python

名前空間/パッケージ名: garage.np.algos

クラス/型: CEM

hotexamples.comのコード掲載数: 2

Python CEM - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのgarage.np.algos.CEMの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

CEM(9)

よく使われるメソッド

CEM (9)

コード例 #1

ファイルを表示

ファイル: test_cem.py プロジェクト: geyang/garage

    def test_cem_cartpole(self):
        """Test CEM with Cartpole-v1 environment."""
        with LocalTFRunner(snapshot_config) as runner:
            env = GymEnv('CartPole-v1')

            policy = CategoricalMLPPolicy(name='policy',
                                          env_spec=env.spec,
                                          hidden_sizes=(32, 32))
            baseline = LinearFeatureBaseline(env_spec=env.spec)

            n_samples = 10

            algo = CEM(env_spec=env.spec,
                       policy=policy,
                       baseline=baseline,
                       best_frac=0.1,
                       n_samples=n_samples)

            runner.setup(algo, env, sampler_cls=LocalSampler)
            rtn = runner.train(n_epochs=10, batch_size=2048)
            assert rtn > 40

            env.close()

コード例 #2

ファイルを表示

ファイル: CEM.py プロジェクト: JiahengHu/swimmer_trajectory_following

def run_task(snapshot_config, *_):
    """Train CEM"""
    with LocalTFRunner(snapshot_config=snapshot_config) as runner:
        env = TfEnv(env_name='Swimmer-v2')

        policy = GaussianMLPPolicy(name='policy',
                                   env_spec=env.spec,
                                   hidden_sizes=(32, 32))

        baseline = LinearFeatureBaseline(env_spec=env.spec)

        n_samples = 20

        algo = CEM(env_spec=env.spec,
                   policy=policy,
                   baseline=baseline,
                   best_frac=0.05,
                   max_path_length=100,
                   n_samples=n_samples)

        runner.setup(algo, env, sampler_cls=OnPolicyVectorizedSampler)
        # NOTE: make sure that n_epoch_cycles == n_samples !
        runner.train(n_epochs=100, batch_size=1000, n_epoch_cycles=n_samples)