Python Agent.train Exemples

Langage de programmation: Python

Espace de nommage/Pack: agents.agent

Class/Type: Agent

Méthode/Fonction: train

Exemples au hotexamples.com: 3

Python Agent.train - 3 exemples trouvés. Ce sont les exemples réels les mieux notés de agents.agent.Agent.train extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Agent(30)

__init__(16)

test(6)

act(3)

prediction_history(3)

reset(3)

run_reps(3)

train(3)

step(3)

get_action(2)

aggregate_history(2)

collect_reward(2)

rank_bet(2)

set_sim_t(2)

state_dict(1)

test_goal_prediction(1)

put_data(1)

restart_coloring(1)

reset_episode(1)

reward_for_action(1)

observe(1)

set_session(1)

set_sim_dt(1)

place_bet(1)

load_model(1)

noisy_eval(1)

apply_control_open_loop(1)

_init_fmm_map(1)

_init_obj_fn(1)

_init_planner(1)

_init_psc_objective(1)

_init_system_dynamics(1)

actions(1)

advantage(1)

calc_weights(1)

memorize(1)

cuda(1)

environment(1)

eval(1)

get_move(1)

infer(1)

init_actor_critic(1)

load_memory(1)

value(1)

Méthodes fréquemment utilisées

Agent (30)

__init__ (16)

test (6)

act (3)

prediction_history (3)

reset (3)

run_reps (3)

train (3)

step (3)

get_action (2)

Méthodes fréquemment utilisées

aggregate_history (2)

collect_reward (2)

rank_bet (2)

set_sim_t (2)

state_dict (1)

test_goal_prediction (1)

put_data (1)

restart_coloring (1)

reset_episode (1)

reward_for_action (1)

observe (1)

set_session (1)

set_sim_dt (1)

place_bet (1)

load_model (1)

noisy_eval (1)

apply_control_open_loop (1)

_init_fmm_map (1)

_init_obj_fn (1)

_init_planner (1)

Méthodes fréquemment utilisées

observe (1)

set_session (1)

set_sim_dt (1)

place_bet (1)

load_model (1)

noisy_eval (1)

apply_control_open_loop (1)

_init_fmm_map (1)

_init_obj_fn (1)

_init_planner (1)

_init_psc_objective (1)

_init_system_dynamics (1)

actions (1)

advantage (1)

calc_weights (1)

memorize (1)

cuda (1)

environment (1)

eval (1)

get_move (1)

infer (1)

init_actor_critic (1)

load_memory (1)

value (1)

Méthodes fréquemment utilisées

_init_psc_objective (1)

_init_system_dynamics (1)

actions (1)

advantage (1)

calc_weights (1)

memorize (1)

cuda (1)

environment (1)

eval (1)

get_move (1)

infer (1)

init_actor_critic (1)

load_memory (1)

value (1)

Exemple #1

0

Afficher le fichier

def train(nb_steps: int, env: Env, agent: Agent, start_obs: Arrayable): """Trains for one epoch. :args nb_steps: number of interaction steps :args env: environment :args agent: interacting agent :start_obs: starting observation :return: final observation """ agent.train() agent.reset() obs = start_obs for _ in range(nb_steps): # interact obs, _, _ = interact(env, agent, obs) return obs

Exemple #2

0

Afficher le fichier

Fichier : main.py Projet : seolhokim/InverseRL-Pytorch

if done: state_ = (env.reset()) state = np.clip( (state_ - state_rms.mean) / (state_rms.var**0.5 + 1e-8), -5, 5) score_lst.append(score) if writer != None: writer.add_scalar("score/real", score, n_epi) writer.add_scalar("score/discriminator", discriminator_score, n_epi) score = 0 discriminator_score = 0 else: state = next_state state_ = next_state_ agent.train(discriminator, discriminator_args.batch_size, state_rms, n_epi) state_rms.update(np.vstack(state_lst)) state_lst = [] if n_epi % args.print_interval == 0 and n_epi != 0: print("# of episode :{}, avg score : {:.1f}".format( n_epi, sum(score_lst) / len(score_lst))) score_lst = [] if (n_epi % args.save_interval == 0) & (n_epi != 0): torch.save(agent.state_dict(), './model_weights/model_' + str(n_epi)) else: #off-policy for n_epi in range(args.epochs): score = 0.0 discriminator_score = 0.0 state = env.reset()

Exemple #3

0

Afficher le fichier

from models.leaky_relu_model import LeakyReluModel from agents.agent import Agent model = LeakyReluModel() agent = Agent(model) print(model.model.summary()) agent.train() model.save() for i in range(0, 100): print(i, model.predict_num(i))