Python evaluate示例

编程语言: Python

命名空间/包名称: tensor2tensor.rl.rl_trainer_lib

方法/功能: evaluate

hotexamples.com的示例: 2

Python evaluate - 已找到2个示例。这些是从开源项目中提取的最受好评的tensor2tensor.rl.rl_trainer_lib.evaluate现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

    def evaluate(self, env_fn, hparams, stochastic):
        if stochastic:
            policy_to_actions_lambda = lambda policy: policy.sample()
        else:
            policy_to_actions_lambda = lambda policy: policy.mode()
        hparams.add_hparam("policy_to_actions_lambda",
                           policy_to_actions_lambda)
        hparams.add_hparam("force_beginning_resets", False)
        hparams.add_hparam("env_fn", env_fn)
        hparams.add_hparam("frame_stack_size", self.frame_stack_size)

        rl_trainer_lib.evaluate(hparams, self.agent_model_dir)

示例#2

显示文件

文件： trainer_model_based.py 项目： yueyedeai/tensor2tensor

def evaluate_single_config(hparams, agent_model_dir):
    """Evaluate the PPO agent in the real environment."""
    eval_hparams = trainer_lib.create_hparams(hparams.ppo_params)
    eval_hparams.num_agents = hparams.num_agents
    env = setup_env(hparams, batch_size=hparams.num_agents)
    environment_spec = rl.standard_atari_env_spec(env)
    eval_hparams.add_hparam("environment_spec", environment_spec)
    eval_hparams.add_hparam("policy_to_actions_lambda",
                            hparams.policy_to_actions_lambda)

    env.start_new_epoch(0)
    rl_trainer_lib.evaluate(eval_hparams, agent_model_dir)
    rollouts = env.current_epoch_rollouts()[:hparams.num_agents]
    env.close()

    assert len(rollouts) == hparams.num_agents
    return tuple(
        compute_mean_reward(rollouts, clipped) for clipped in (True, False))