Python Agent.load_actor 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: ddpg_agent

클래스/타입: Agent

메소드/함수: load_actor

hotexamples.com에서의 예제들: 2

Python Agent.load_actor - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ddpg_agent.Agent.load_actor에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Agent(30)

act(30)

step(27)

reset(23)

actor_local(4)

actor_target(3)

save(3)

load(2)

remember(2)

memory(2)

memorize(2)

load_actor(2)

load_critic(2)

choose_action(2)

critic_target(2)

critic_local(2)

learn(2)

ave_loss(1)

update(1)

store(1)

actor_optimizer(1)

set_hparams(1)

sense(1)

save_models(1)

learn_from_players(1)

reset_episode(1)

critic_optimizer(1)

load_weights(1)

load_models(1)

load_model(1)

Explore(1)

cum_rewards(1)

update_step(1)

예제 #1

파일 보기

        scores_window.append(score)  # save most recent score
        list_scores.append(score)  # save most recent score
        print('\rEpisode {}\tAverage Score: {:.2f}'.format(
            i_episode, np.mean(scores_window)),
              end="")
        if i_episode % 100 == 0:
            print('\rEpisode {}\tAverage Score: {:.2f}'.format(
                i_episode, np.mean(scores_window)))
    return list_scores


if __name__ == '__main__':

    print(opt)
    env = UnityEnvironment(file_name="Reacher.app")
    brain_name = env.brain_names[0]
    brain = env.brains[brain_name]
    env_info = env.reset(train_mode=True)[brain_name]
    state_size, action_size = get_settings(env_info, brain)

    agent1 = Agent(state_size, action_size, opt.seed)
    agent1.load_actor(opt.actor_model_path)
    agent1.load_critic(opt.critic_model_path)

    agent2 = Agent(state_size, action_size, opt.seed)
    agent2.load_actor(opt.actor_model_path)
    agent2.load_critic(opt.critic_model_path)

    scores = infer_agent(env, agent1, agent2, brain_name)
    env.close()

예제 #2

파일 보기

            #agent.step(state, action, reward, next_state, done)
            state = next_state
            score += reward
            if done:
                break
        scores_window.append(score)  # save most recent score
        scores.append(score)  # save most recent score
        print('\rEpisode {}\tAverage Score: {:.2f}'.format(
            i_episode, np.mean(scores_window)),
              end="")
        if i_episode % 100 == 0:
            print('\rEpisode {}\tAverage Score: {:.2f}'.format(
                i_episode, np.mean(scores_window)))
    return scores


if __name__ == '__main__':

    print(opt)
    env = UnityEnvironment(file_name="Reacher.app")
    brain_name = env.brain_names[0]
    brain = env.brains[brain_name]
    env_info = env.reset(train_mode=True)[brain_name]
    state_size, action_size = get_settings(env_info, brain)

    agent = Agent(state_size, action_size, opt.seed)
    agent = agent.load_actor(opt.actor_model_path)
    agent = agent.load_critic(opt.critic_model_path)
    scores = infer_agent(env, agent, brain_name)
    env.close()