Python MultiMonitor示例

编程语言: Python

命名空间/包名称: aprl.common.multi_monitor

类/类型: MultiMonitor

hotexamples.com的示例: 5

Python MultiMonitor - 已找到5个示例。这些是从开源项目中提取的最受好评的aprl.common.multi_monitor.MultiMonitor现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

MultiMonitor(5)

step(2)

seed(1)

示例#1

显示文件

 def make_env(i):
     env = gym.make(args.env)
     env = MultiMonitor(env,
                        os.path.join(out_path, 'mon{:d}'.format(i)),
                        allow_early_resets=True)
     env.seed(args.seed + 10 * i)
     return env

示例#2

显示文件

文件： test_common.py 项目： wh-forker/adversarial-policies

def test_multi_monitor():
    """Smoke test for MultiMonitor."""
    env = gym.make("aprl/IteratedMatchingPennies-v0")
    env.seed(42)
    with tempfile.TemporaryDirectory(prefix="test_multi_mon") as d:
        env = MultiMonitor(env, filename=os.path.join(d, "test"))
        for eps in range(5):
            env.reset()
            done = False
            while not done:
                a = env.action_space.sample()
                _, _, done, info = env.step(a)
            epinfo = info["episode"]
            assert set(epinfo.keys()) == {"r", "r0", "r1", "l", "t"}

示例#3

显示文件

def test_multi_monitor():
    """Smoke test for MultiMonitor."""
    env = gym.make('aprl/IteratedMatchingPennies-v0')
    env.seed(42)
    with tempfile.TemporaryDirectory(prefix='test_multi_mon') as d:
        env = MultiMonitor(env, filename=os.path.join(d, 'test'))
        for eps in range(5):
            env.reset()
            done = False
            while not done:
                a = env.action_space.sample()
                _, _, done, info = env.step(a)
            epinfo = info['episode']
            assert set(epinfo.keys()) == {'r', 'r0', 'r1', 'l', 't'}

示例#4

显示文件

文件： utils.py 项目： wwxFromTju/adversarial-policies

def make_env(env_name,
             seed,
             i,
             out_dir,
             our_idx=None,
             pre_wrapper=None,
             post_wrapper=None,
             agent_wrappers=None):
    multi_env = gym.make(env_name)
    if agent_wrappers is not None:
        for agent_id in agent_wrappers:
            multi_env.agents[agent_id] = agent_wrappers[agent_id](
                multi_env.agents[agent_id])
    if pre_wrapper is not None:
        multi_env = pre_wrapper(multi_env)
    if not isinstance(multi_env, MultiAgentEnv):
        multi_env = SingleToMulti(multi_env)
    multi_env.seed(seed + i)

    if out_dir is not None:
        mon_dir = osp.join(out_dir, 'mon')
        os.makedirs(mon_dir, exist_ok=True)
        multi_env = MultiMonitor(multi_env,
                                 osp.join(mon_dir, 'log{}'.format(i)), our_idx)

    if post_wrapper is not None:
        multi_env = post_wrapper(multi_env)

    return multi_env

示例#5

显示文件

def make_env(
    env_name,
    seed,
    i,
    out_dir,
    our_idx=None,
    pre_wrappers=None,
    post_wrappers=None,
    agent_wrappers=None,
):
    multi_env = gym.make(env_name)

    if agent_wrappers is not None:
        for agent_id in agent_wrappers:
            multi_env.agents[agent_id] = agent_wrappers[agent_id](
                multi_env.agents[agent_id])

    multi_env = _apply_wrappers(pre_wrappers, multi_env)

    if not hasattr(multi_env, "num_agents"):
        multi_env = SingleToMulti(multi_env)

    if out_dir is not None:
        mon_dir = osp.join(out_dir, "mon")
        os.makedirs(mon_dir, exist_ok=True)
        multi_env = MultiMonitor(multi_env,
                                 osp.join(mon_dir, "log{}".format(i)), our_idx)

    multi_env = _apply_wrappers(post_wrappers, multi_env)

    multi_env.seed(seed + i)

    return multi_env