Python ContinuousMLPPolicy.get_action示例

编程语言: Python

命名空间/包名称: metarl.tf.policies

方法/功能: get_action

hotexamples.com的示例: 2

Python ContinuousMLPPolicy.get_action - 已找到2个示例。这些是从开源项目中提取的最受好评的metarl.tf.policies.ContinuousMLPPolicy.get_action现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

ContinuousMLPPolicy(18)

get_action(2)

get_action_sym(1)

get_actions(1)

get_regularizable_vars(1)

示例#1

显示文件

文件： test_policies.py 项目： neurips2020submission11699/metarl

    def test_continuous_mlp_policy(self):
        continuous_mlp_policy = ContinuousMLPPolicy(env_spec=self.env,
                                                    hidden_sizes=(1, ))
        self.sess.run(tf.compat.v1.global_variables_initializer())

        obs = self.env.observation_space.high
        assert continuous_mlp_policy.get_action(obs)

示例#2

显示文件

    def test_get_action(self, obs_dim, action_dim):
        """Test get_action method"""
        env = TfEnv(DummyBoxEnv(obs_dim=obs_dim, action_dim=action_dim))
        with mock.patch(('metarl.tf.policies.'
                         'continuous_mlp_policy.MLPModel'),
                        new=SimpleMLPModel):
            policy = ContinuousMLPPolicy(env_spec=env.spec)

        env.reset()
        obs, _, _, _ = env.step(1)

        action, _ = policy.get_action(obs.flatten())

        expected_action = np.full(action_dim, 0.5)

        assert env.action_space.contains(action)
        assert np.array_equal(action, expected_action)

        actions, _ = policy.get_actions(
            [obs.flatten(), obs.flatten(),
             obs.flatten()])
        for action in actions:
            assert env.action_space.contains(action)
            assert np.array_equal(action, expected_action)