Esempi in Python per Agent.learn

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: agents

Classe/tipologia: Agent

Metodo/funzione: learn

Esempi su hotexamples.com: 2

Agent.learn in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per agents.Agent.learn, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Agent(30)

run_episode(4)

act(4)

__init__(3)

name(3)

get_move(3)

eval(3)

mark(2)

move(2)

get_action(2)

from_conf(2)

reset(2)

learn(2)

test(2)

build_trajectories(2)

ships(1)

log_activity_active(1)

log_activity_idle(1)

update_t_pref(1)

update_belief(1)

train_model(1)

train(1)

on(1)

parameters(1)

ppo_update(1)

precepts(1)

symbol(1)

set_train_mode(1)

stop(1)

preference_position(1)

step(1)

program(1)

state(1)

load_curve_certificate(1)

start(1)

sample_duration_current_state(1)

save(1)

set_current_activity_end(1)

reset_graph_info(1)

input_vector(1)

load(1)

choose_state(1)

ac_model(1)

add_actuator(1)

add_event(1)

add_id(1)

add_sensor(1)

append_sample(1)

bombs_left(1)

Esempio n. 1

Mostra file

def loop(
    env: gym.Env,
    agent: agents.Agent,
    num_episodes: int,
    epsilon: float,
    should_learn: bool,
):
    wins = 0
    episode = 1
    observation = env.reset()

    env.render()
    while episode <= num_episodes:
        if random() < epsilon:
            action = env.action_space.sample()
        else:
            action = agent.act(observation)

        new_observation, reward, done, info = env.step(action)

        if should_learn:
            agent.learn(observation, action, new_observation, reward)

        env.render()
        print("\tEpisodes:", episode, "\tWins:", wins)
        print("\tWin Ratio:", wins / episode)

        if done:
            observation = env.reset()
            env.render()
            episode += 1
            if reward:
                wins += 1
        else:
            observation = new_observation

    env.close()

Esempio n. 2

Mostra file

    _agent = Agent((8,), 4)
    if os.path.exists(_f_checkpoint):
        _agent.net.load_checkpoint(_f_checkpoint)

    _writer = SummaryWriter(_d_log)
    _is_quit = False
    while _episode < _n_games:
        _observation = _env.reset()
        _done = False
        _score = 0.0
        while not _done:
            _action = _agent.get_action(_observation)
            _next_observation, _reward, _done, _info = _env.step(_action)
            _score += _reward
            _agent.learn(_observation, _reward, _next_observation, _done)
            _observation = _next_observation

            _rgb = _env.render("rgb_array")
            _bgr = cv2.cvtColor(_rgb, cv2.COLOR_RGB2BGR)
            cv2.imshow("frame", _bgr)
            _key_code = cv2.waitKey(1)
            if _key_code in [27, ord('q')]:
                _is_quit = True
                break
        if _is_quit:
            break
        _scores.append(_score)
        _episode += 1
        _avg_score = float(np.mean(_scores[-100:]))
        if _episode % 500 == 0: