Python Monitor.close 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: stable_baselines3.common.monitor

클래스/타입: Monitor

메소드/함수: close

hotexamples.com에서의 예제들: 2

Python Monitor.close - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 stable_baselines3.common.monitor.Monitor.close에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Monitor(30)

reset(11)

step(6)

seed(4)

close(2)

_reset(1)

get_episode_lengths(1)

get_episode_rewards(1)

get_episode_times(1)

get_total_steps(1)

plot(1)

plot_policy(1)

policyfn(1)

render(1)

simulate(1)

tensorboard_log(1)

예제 #1

파일 보기

파일: test_monitor.py 프로젝트: Vincent-Fu-Lab/Apprentissage-par-renforcement-profond-sur-Pendulum

def test_monitor(tmp_path):
    """
    Test the monitor wrapper
    """
    env = gym.make("CartPole-v1")
    env.seed(0)
    monitor_file = os.path.join(
        str(tmp_path),
        "stable_baselines-test-{}.monitor.csv".format(uuid.uuid4()))
    monitor_env = Monitor(env, monitor_file)
    monitor_env.reset()
    total_steps = 1000
    ep_rewards = []
    ep_lengths = []
    ep_len, ep_reward = 0, 0
    for _ in range(total_steps):
        _, reward, done, _ = monitor_env.step(
            monitor_env.action_space.sample())
        ep_len += 1
        ep_reward += reward
        if done:
            ep_rewards.append(ep_reward)
            ep_lengths.append(ep_len)
            monitor_env.reset()
            ep_len, ep_reward = 0, 0

    monitor_env.close()
    assert monitor_env.get_total_steps() == total_steps
    assert sum(ep_lengths) == sum(monitor_env.get_episode_lengths())
    assert sum(monitor_env.get_episode_rewards()) == sum(ep_rewards)
    _ = monitor_env.get_episode_times()

    with open(monitor_file, "rt") as file_handler:
        first_line = file_handler.readline()
        assert first_line.startswith("#")
        metadata = json.loads(first_line[1:])
        assert metadata["env_id"] == "CartPole-v1"
        assert set(metadata.keys()) == {"env_id", "t_start"
                                        }, "Incorrect keys in monitor metadata"

        last_logline = pandas.read_csv(file_handler, index_col=None)
        assert set(
            last_logline.keys()) == {"l", "t",
                                     "r"}, "Incorrect keys in monitor logline"
    os.remove(monitor_file)

예제 #2

파일 보기

               out_ref=inflow.expectation(),
               **env_cfg)
with open(f'{timestamp}/env.txt', 'w') as f:
    print(str(env), file=f)
with open(f'{timestamp}/inflow.txt', 'w') as f:
    print(str(inflow), file=f)
env = Monitor(env)

model = PPO('MlpPolicy',
            env,
            verbose=1,
            tensorboard_log=f'{timestamp}/',
            gamma=.5)
model.learn(total_timesteps=5000000)
model.save(f'{timestamp}/model')

visualize_nets(env, model, timestamp)

rec = VideoRecorder(env, f'{timestamp}/vid.mp4')
obs = env.reset()
for i in range(1000):
    action, _states = model.predict(obs, deterministic=True)
    obs, reward, done, info = env.step(action)
    env.unwrapped.render()
    rec.capture_frame()
    if done:
        obs = env.reset()

env.close()
rec.close()