Python Agent.load_criticの例

プログラミング言語: Python

名前空間/パッケージ名: ddpg_agent

クラス/型: Agent

メソッド/関数: load_critic

hotexamples.comのコード掲載数: 2

Python Agent.load_critic - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのddpg_agent.Agent.load_criticの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Agent(30)

act(30)

step(27)

reset(23)

actor_local(4)

actor_target(3)

save(3)

load(2)

remember(2)

memory(2)

memorize(2)

load_actor(2)

load_critic(2)

choose_action(2)

critic_target(2)

critic_local(2)

learn(2)

ave_loss(1)

update(1)

store(1)

actor_optimizer(1)

set_hparams(1)

sense(1)

save_models(1)

learn_from_players(1)

reset_episode(1)

critic_optimizer(1)

load_weights(1)

load_models(1)

load_model(1)

Explore(1)

cum_rewards(1)

update_step(1)

コード例 #1

ファイルを表示

        scores_window.append(score)  # save most recent score
        list_scores.append(score)  # save most recent score
        print('\rEpisode {}\tAverage Score: {:.2f}'.format(
            i_episode, np.mean(scores_window)),
              end="")
        if i_episode % 100 == 0:
            print('\rEpisode {}\tAverage Score: {:.2f}'.format(
                i_episode, np.mean(scores_window)))
    return list_scores


if __name__ == '__main__':

    print(opt)
    env = UnityEnvironment(file_name="Reacher.app")
    brain_name = env.brain_names[0]
    brain = env.brains[brain_name]
    env_info = env.reset(train_mode=True)[brain_name]
    state_size, action_size = get_settings(env_info, brain)

    agent1 = Agent(state_size, action_size, opt.seed)
    agent1.load_actor(opt.actor_model_path)
    agent1.load_critic(opt.critic_model_path)

    agent2 = Agent(state_size, action_size, opt.seed)
    agent2.load_actor(opt.actor_model_path)
    agent2.load_critic(opt.critic_model_path)

    scores = infer_agent(env, agent1, agent2, brain_name)
    env.close()

コード例 #2

ファイルを表示

            #agent.step(state, action, reward, next_state, done)
            state = next_state
            score += reward
            if done:
                break
        scores_window.append(score)  # save most recent score
        scores.append(score)  # save most recent score
        print('\rEpisode {}\tAverage Score: {:.2f}'.format(
            i_episode, np.mean(scores_window)),
              end="")
        if i_episode % 100 == 0:
            print('\rEpisode {}\tAverage Score: {:.2f}'.format(
                i_episode, np.mean(scores_window)))
    return scores


if __name__ == '__main__':

    print(opt)
    env = UnityEnvironment(file_name="Reacher.app")
    brain_name = env.brain_names[0]
    brain = env.brains[brain_name]
    env_info = env.reset(train_mode=True)[brain_name]
    state_size, action_size = get_settings(env_info, brain)

    agent = Agent(state_size, action_size, opt.seed)
    agent = agent.load_actor(opt.actor_model_path)
    agent = agent.load_critic(opt.critic_model_path)
    scores = infer_agent(env, agent, brain_name)
    env.close()