Esempi in Python per Agent.train

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: agents.agent

Classe/tipologia: Agent

Metodo/funzione: train

Esempi su hotexamples.com: 3

Agent.train in Python: 3 esempi trovati. Questi sono i migliori esempi reali in Python per agents.agent.Agent.train, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Agent(30)

__init__(16)

test(6)

act(3)

prediction_history(3)

reset(3)

run_reps(3)

train(3)

step(3)

get_action(2)

aggregate_history(2)

collect_reward(2)

rank_bet(2)

set_sim_t(2)

state_dict(1)

test_goal_prediction(1)

put_data(1)

restart_coloring(1)

reset_episode(1)

reward_for_action(1)

observe(1)

set_session(1)

set_sim_dt(1)

place_bet(1)

load_model(1)

noisy_eval(1)

apply_control_open_loop(1)

_init_fmm_map(1)

_init_obj_fn(1)

_init_planner(1)

_init_psc_objective(1)

_init_system_dynamics(1)

actions(1)

advantage(1)

calc_weights(1)

memorize(1)

cuda(1)

environment(1)

eval(1)

get_move(1)

infer(1)

init_actor_critic(1)

load_memory(1)

value(1)

Esempio n. 1

Mostra file

def train(nb_steps: int, env: Env, agent: Agent, start_obs: Arrayable):
    """Trains for one epoch.

    :args nb_steps: number of interaction steps
    :args env: environment
    :args agent: interacting agent
    :start_obs: starting observation

    :return: final observation
    """
    agent.train()
    agent.reset()
    obs = start_obs
    for _ in range(nb_steps):
        # interact
        obs, _, _ = interact(env, agent, obs)
    return obs

Esempio n. 2

Mostra file

File: main.py Progetto: seolhokim/InverseRL-Pytorch

            if done:
                state_ = (env.reset())
                state = np.clip(
                    (state_ - state_rms.mean) / (state_rms.var**0.5 + 1e-8),
                    -5, 5)
                score_lst.append(score)
                if writer != None:
                    writer.add_scalar("score/real", score, n_epi)
                    writer.add_scalar("score/discriminator",
                                      discriminator_score, n_epi)
                score = 0
                discriminator_score = 0
            else:
                state = next_state
                state_ = next_state_
        agent.train(discriminator, discriminator_args.batch_size, state_rms,
                    n_epi)
        state_rms.update(np.vstack(state_lst))
        state_lst = []
        if n_epi % args.print_interval == 0 and n_epi != 0:
            print("# of episode :{}, avg score : {:.1f}".format(
                n_epi,
                sum(score_lst) / len(score_lst)))
            score_lst = []
        if (n_epi % args.save_interval == 0) & (n_epi != 0):
            torch.save(agent.state_dict(),
                       './model_weights/model_' + str(n_epi))
else:  #off-policy
    for n_epi in range(args.epochs):
        score = 0.0
        discriminator_score = 0.0
        state = env.reset()

Esempio n. 3

Mostra file

from models.leaky_relu_model import LeakyReluModel
from agents.agent import Agent

model = LeakyReluModel()
agent = Agent(model)
print(model.model.summary())
agent.train()
model.save()
for i in range(0, 100):
    print(i, model.predict_num(i))