Python Agent.learn Examples

Programming Language: Python

Namespace/Package Name: agents

Class/Type: Agent

Method/Function: learn

Examples at hotexamples.com: 2

Python Agent.learn - 2 examples found. These are the top rated real world Python examples of agents.Agent.learn extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

Agent(30)

run_episode(4)

act(4)

__init__(3)

name(3)

get_move(3)

eval(3)

mark(2)

move(2)

get_action(2)

from_conf(2)

reset(2)

learn(2)

test(2)

build_trajectories(2)

ships(1)

log_activity_active(1)

log_activity_idle(1)

update_t_pref(1)

update_belief(1)

train_model(1)

train(1)

on(1)

parameters(1)

ppo_update(1)

precepts(1)

symbol(1)

set_train_mode(1)

stop(1)

preference_position(1)

step(1)

program(1)

state(1)

load_curve_certificate(1)

start(1)

sample_duration_current_state(1)

save(1)

set_current_activity_end(1)

reset_graph_info(1)

input_vector(1)

load(1)

choose_state(1)

ac_model(1)

add_actuator(1)

add_event(1)

add_id(1)

add_sensor(1)

append_sample(1)

bombs_left(1)

Example #1

Show file

def loop(
    env: gym.Env,
    agent: agents.Agent,
    num_episodes: int,
    epsilon: float,
    should_learn: bool,
):
    wins = 0
    episode = 1
    observation = env.reset()

    env.render()
    while episode <= num_episodes:
        if random() < epsilon:
            action = env.action_space.sample()
        else:
            action = agent.act(observation)

        new_observation, reward, done, info = env.step(action)

        if should_learn:
            agent.learn(observation, action, new_observation, reward)

        env.render()
        print("\tEpisodes:", episode, "\tWins:", wins)
        print("\tWin Ratio:", wins / episode)

        if done:
            observation = env.reset()
            env.render()
            episode += 1
            if reward:
                wins += 1
        else:
            observation = new_observation

    env.close()

Example #2

Show file

    _agent = Agent((8,), 4)
    if os.path.exists(_f_checkpoint):
        _agent.net.load_checkpoint(_f_checkpoint)

    _writer = SummaryWriter(_d_log)
    _is_quit = False
    while _episode < _n_games:
        _observation = _env.reset()
        _done = False
        _score = 0.0
        while not _done:
            _action = _agent.get_action(_observation)
            _next_observation, _reward, _done, _info = _env.step(_action)
            _score += _reward
            _agent.learn(_observation, _reward, _next_observation, _done)
            _observation = _next_observation

            _rgb = _env.render("rgb_array")
            _bgr = cv2.cvtColor(_rgb, cv2.COLOR_RGB2BGR)
            cv2.imshow("frame", _bgr)
            _key_code = cv2.waitKey(1)
            if _key_code in [27, ord('q')]:
                _is_quit = True
                break
        if _is_quit:
            break
        _scores.append(_score)
        _episode += 1
        _avg_score = float(np.mean(_scores[-100:]))
        if _episode % 500 == 0: