Python Visualizer.plot_rewardの例

プログラミング言語: Python

名前空間/パッケージ名: utils

クラス/型: Visualizer

メソッド/関数: plot_reward

hotexamples.comのコード掲載数: 3

Python Visualizer.plot_reward - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのutils.Visualizer.plot_rewardの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

plot(30)

Visualizer(30)

log(17)

plot_many(11)

img(8)

text(8)

display_current_results(4)

save(4)

plot_reward(3)

insert(3)

show(2)

plot_episode_length(2)

images(2)

draw(2)

close(2)

generate_3d_trajectory(2)

write(2)

generate_trajectory(2)

generate_trajectories(2)

rmse_evol(1)

visualize(1)

vis_table(1)

vis_scalar(1)

update_batch(1)

check_connection(1)

save_and_show(1)

generate_random_visuals_depth(1)

plot_current_losses(1)

plot_rmse_t(1)

img_many(1)

plot_mle(1)

plot_many_stack(1)

generate_random_visuals(1)

plot_loss(1)

plot_hist_x(1)

box_plot(1)

plot_curves(1)

plot_thetas_line(1)

コード例 #1

ファイルを表示

ファイル: run_TD.py プロジェクト: victorvg17/rl-uni-project

    episodes = args.episode
    time_steps = args.steps
    epsilon = args.epsilon
    render = args.render

    # --- run algorithm ---
    # td_lam.load_models()
    stats = td_lam.train(env, episodes, time_steps, epsilon)
    # td_lam.save_models()

    # --- visualize the results ---
    result_folder = Path(__file__).resolve().parent / 'results'
    viz = Visualizer(result_path=result_folder)
    viz.plot_episode_length(stats,
                            plot_name='td_episode_length_{}'.format(
                                args.exp_count))
    viz.plot_reward(stats, plot_name='td_rewards_{}'.format(args.exp_count))

    # --- animation ---
    if render:
        with contextlib.closing(ContinuousCartPoleEnv()) as env:
            for _ in range(2):
                s = env.reset()
                for _ in range(300):
                    env.render()
                    a = td_lam.get_action(s, epsilon=0.02)
                    s, _, d, _ = env.step(a)
                    if d:
                        break

コード例 #2

ファイルを表示

ファイル: run_reinforce_discrete.py プロジェクト: victorvg17/rl-uni-project

                          action_dim,
                          gamma=0.99,
                          hidden_dim=hidden_dim,
                          policy_lr=policy_lr,
                          baseline_lr=baseline_lr,
                          d2c=d2c_converter)

    # --- run algorithm ---
    if load_flag:
        reinforce.load_models(model_name=exp_count)
    stats = reinforce.train(env=env, episodes=episodes, time_steps=timesteps)
    reinforce.save_models(model_name=exp_count)

    # --- visualize the results ---
    result_folder = Path(__file__).resolve().parent / 'results'
    viz = Visualizer(result_path=result_folder)
    viz.plot_episode_length(stats, plot_name=f'r_d_episodes_{exp_count}')
    viz.plot_reward(stats, plot_name=f'r_d_rewards_{exp_count}')

    # --- animation ---
    if render_flag:
        with contextlib.closing(ContinuousCartPoleEnv()) as env:
            for _ in range(2):
                s = env.reset()
                for _ in range(500):
                    env.render()
                    a, _ = reinforce.get_action(s)
                    s, _, d, _ = env.step(a)
                    if d:
                        break

コード例 #3

ファイルを表示

              critic_lr=critic_lr,
              K_epochs=K_epochs,
              eps_clip=eps_clip,
              entropy_coeff=entropy_coeff,
              verbose=verbose_flag)
    if load_flag:
        ppo.load_models(model_name=exp_count)
    stats = ppo.train(env=env,
                      episodes=episodes,
                      timesteps=timesteps,
                      update_timestep=update_timestep)
    ppo.save_models(model_name=exp_count)

    # --- visualize the results ---
    result_folder = Path(__file__).resolve().parent / 'results'
    viz = Visualizer(result_path=result_folder)
    viz.plot_episode_length(stats, plot_name=f'ppo_c_episodes_{exp_count}')
    viz.plot_reward(stats, plot_name=f'ppo_c_rewards_{exp_count}')

    # --- animation ---
    if render_flag:
        with contextlib.closing(ContinuousCartPoleEnv()) as env:
            for _ in range(3):
                s = env.reset()
                for _ in range(500):
                    env.render()
                    a = ppo.get_action(s)
                    s, _, d, _ = env.step(a)
                    if d:
                        break