Exemplos de Visualizer.plot_reward em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: utils

Classe / Tipo: Visualizer

Método / Função: plot_reward

Exemplos em hotexamples.com: 3

Visualizer.plot_reward em Python - 3 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de utils.Visualizer.plot_reward em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

plot(30)

Visualizer(30)

log(17)

plot_many(11)

img(8)

text(8)

display_current_results(4)

save(4)

plot_reward(3)

insert(3)

show(2)

plot_episode_length(2)

images(2)

draw(2)

close(2)

generate_3d_trajectory(2)

write(2)

generate_trajectory(2)

generate_trajectories(2)

rmse_evol(1)

visualize(1)

vis_table(1)

vis_scalar(1)

update_batch(1)

check_connection(1)

save_and_show(1)

generate_random_visuals_depth(1)

plot_current_losses(1)

plot_rmse_t(1)

img_many(1)

plot_mle(1)

plot_many_stack(1)

generate_random_visuals(1)

plot_loss(1)

plot_hist_x(1)

box_plot(1)

plot_curves(1)

plot_thetas_line(1)

Métodos Frequentes

plot (30)

Visualizer (30)

log (17)

plot_many (11)

img (8)

text (8)

display_current_results (4)

save (4)

plot_reward (3)

insert (3)

Métodos Frequentes

show (2)

plot_episode_length (2)

images (2)

draw (2)

close (2)

generate_3d_trajectory (2)

write (2)

generate_trajectory (2)

generate_trajectories (2)

rmse_evol (1)

visualize (1)

vis_table (1)

vis_scalar (1)

update_batch (1)

check_connection (1)

save_and_show (1)

generate_random_visuals_depth (1)

plot_current_losses (1)

plot_rmse_t (1)

img_many (1)

Métodos Frequentes

visualize (1)

vis_table (1)

vis_scalar (1)

update_batch (1)

check_connection (1)

save_and_show (1)

generate_random_visuals_depth (1)

plot_current_losses (1)

plot_rmse_t (1)

img_many (1)

plot_mle (1)

plot_many_stack (1)

generate_random_visuals (1)

plot_loss (1)

plot_hist_x (1)

box_plot (1)

plot_curves (1)

plot_thetas_line (1)

Métodos Frequentes

plot_mle (1)

plot_many_stack (1)

generate_random_visuals (1)

plot_loss (1)

plot_hist_x (1)

box_plot (1)

plot_curves (1)

plot_thetas_line (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: run_TD.py Projeto: victorvg17/rl-uni-project

episodes = args.episode time_steps = args.steps epsilon = args.epsilon render = args.render # --- run algorithm --- # td_lam.load_models() stats = td_lam.train(env, episodes, time_steps, epsilon) # td_lam.save_models() # --- visualize the results --- result_folder = Path(__file__).resolve().parent / 'results' viz = Visualizer(result_path=result_folder) viz.plot_episode_length(stats, plot_name='td_episode_length_{}'.format( args.exp_count)) viz.plot_reward(stats, plot_name='td_rewards_{}'.format(args.exp_count)) # --- animation --- if render: with contextlib.closing(ContinuousCartPoleEnv()) as env: for _ in range(2): s = env.reset() for _ in range(300): env.render() a = td_lam.get_action(s, epsilon=0.02) s, _, d, _ = env.step(a) if d: break

Exemplo n.º 2

0

Exibir arquivo

Arquivo: run_reinforce_discrete.py Projeto: victorvg17/rl-uni-project

action_dim, gamma=0.99, hidden_dim=hidden_dim, policy_lr=policy_lr, baseline_lr=baseline_lr, d2c=d2c_converter) # --- run algorithm --- if load_flag: reinforce.load_models(model_name=exp_count) stats = reinforce.train(env=env, episodes=episodes, time_steps=timesteps) reinforce.save_models(model_name=exp_count) # --- visualize the results --- result_folder = Path(__file__).resolve().parent / 'results' viz = Visualizer(result_path=result_folder) viz.plot_episode_length(stats, plot_name=f'r_d_episodes_{exp_count}') viz.plot_reward(stats, plot_name=f'r_d_rewards_{exp_count}') # --- animation --- if render_flag: with contextlib.closing(ContinuousCartPoleEnv()) as env: for _ in range(2): s = env.reset() for _ in range(500): env.render() a, _ = reinforce.get_action(s) s, _, d, _ = env.step(a) if d: break

Exemplo n.º 3

0

Exibir arquivo

critic_lr=critic_lr, K_epochs=K_epochs, eps_clip=eps_clip, entropy_coeff=entropy_coeff, verbose=verbose_flag) if load_flag: ppo.load_models(model_name=exp_count) stats = ppo.train(env=env, episodes=episodes, timesteps=timesteps, update_timestep=update_timestep) ppo.save_models(model_name=exp_count) # --- visualize the results --- result_folder = Path(__file__).resolve().parent / 'results' viz = Visualizer(result_path=result_folder) viz.plot_episode_length(stats, plot_name=f'ppo_c_episodes_{exp_count}') viz.plot_reward(stats, plot_name=f'ppo_c_rewards_{exp_count}') # --- animation --- if render_flag: with contextlib.closing(ContinuousCartPoleEnv()) as env: for _ in range(3): s = env.reset() for _ in range(500): env.render() a = ppo.get_action(s) s, _, d, _ = env.step(a) if d: break