Python AgentLearnerの例

プログラミング言語: Python

名前空間/パッケージ名: fast_rl.core.Learner

クラス/型: AgentLearner

hotexamples.comのコード掲載数: 12

Python AgentLearner - 12件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのfast_rl.core.Learner.AgentLearnerの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

AgentLearner(12)

fit(10)

predict(2)

よく使われるメソッド

AgentLearner (12)

fit (10)

predict (2)

コード例 #1

ファイルを表示

def test_interpretation_plot_q_dqn_returns():
    data = MDPDataBunch.from_env('maze-random-5x5-v0', render='human')
    model = DQN(data)
    learn = AgentLearner(data, model)
    learn.fit(5)
    interp = AgentInterpretationAlpha(learn)
    interp.plot_heatmapped_episode(2)

コード例 #2

ファイルを表示

def test_interpretation_plot_sequence():
    data = MDPDataBunch.from_env('maze-random-5x5-v0',
                                 render='human',
                                 max_steps=1000)
    model = DQN(data)
    learn = AgentLearner(data, model)

    epochs = 20

    callbacks = learn.model.callbacks  # type: Collection[LearnerCallback]
    [c.on_train_begin(learn=learn, n_epochs=epochs) for c in callbacks]
    for epoch in range(epochs):
        [c.on_epoch_begin(epoch=epoch) for c in callbacks]
        learn.model.train()
        counter = 0
        for element in learn.data.train_dl:
            learn.data.train_ds.actions = learn.predict(element)
            [c.on_step_end(learn=learn) for c in callbacks]

            counter += 1
            # if counter % 100 == 0:# or counter == 0:
        interp = AgentInterpretationAlpha(learn, ds_type=DatasetType.Train)
        interp.plot_heatmapped_episode(epoch)

        [c.on_epoch_end() for c in callbacks]
    [c.on_train_end() for c in callbacks]

コード例 #3

ファイルを表示

def test_interpretation_heatmap():
    data = MDPDataBunch.from_env('maze-random-5x5-v0', render='human')
    model = DQN(data)
    learn = AgentLearner(data, model)

    epochs = 10

    callbacks = learn.model.callbacks  # type: Collection[LearnerCallback]
    [c.on_train_begin(learn=learn, n_epochs=epochs) for c in callbacks]
    for epoch in range(epochs):
        [c.on_epoch_begin(epoch=epoch) for c in callbacks]
        learn.model.train()
        for element in learn.data.train_dl:
            learn.data.train_ds.actions = learn.predict(element)
            [c.on_step_end(learn=learn) for c in callbacks]
        [c.on_epoch_end() for c in callbacks]

        # For now we are going to avoid executing learner_callbacks here.
        learn.model.eval()
        for element in learn.data.valid_dl:
            learn.data.valid_ds.actions = learn.predict(element)

        if epoch % 1 == 0:
            interp = AgentInterpretationAlpha(learn)
            interp.plot_heatmapped_episode(epoch)
    [c.on_train_end() for c in callbacks]

コード例 #4

ファイルを表示

ファイル: test_agent_core.py プロジェクト: swelchm/fast-reinforcement-learning

def test_fit_function_dqn():
    data = MDPDataBunch.from_env('maze-random-5x5-v0',
                                 render='human',
                                 max_steps=1000)
    model = DQN(data, memory=PriorityExperienceReplay(1000))
    learn = AgentLearner(data, model)
    learn.fit(5)

コード例 #5

ファイルを表示

ファイル: test_agent_core.py プロジェクト: swelchm/fast-reinforcement-learning

def test_priority_experience_replay():
    data = MDPDataBunch.from_env('maze-random-5x5-v0',
                                 render='human',
                                 max_steps=1000)
    model = FixedTargetDQN(data, memory=PriorityExperienceReplay(1000))
    learn = AgentLearner(data, model)
    learn.fit(5)

コード例 #6

ファイルを表示

ファイル: test_dqn_models.py プロジェクト: swelchm/fast-reinforcement-learning

def test_double_dueling_dqn_model_maze():
    data = MDPDataBunch.from_env('maze-random-5x5-v0',
                                 render='human',
                                 max_steps=1000)
    model = DoubleDuelingDQN(data)
    learn = AgentLearner(data, model)

    learn.fit(5)

コード例 #7

ファイルを表示

ファイル: test_dqn_models.py プロジェクト: swelchm/fast-reinforcement-learning

def test_basic_dqn_model_maze():
    data = MDPDataBunch.from_env('maze-random-5x5-v0',
                                 render='human',
                                 max_steps=200)
    model = DQN(data)
    learn = AgentLearner(data, model)

    learn.fit(5)

コード例 #8

ファイルを表示

ファイル: test_dqn_models.py プロジェクト: swelchm/fast-reinforcement-learning

def test_fixed_target_dqn_model_maze():
    print('\n')
    data = MDPDataBunch.from_env('maze-random-5x5-v0',
                                 render='human',
                                 max_steps=1000)
    model = FixedTargetDQN(data)
    learn = AgentLearner(data, model)

    learn.fit(5)

コード例 #9

ファイルを表示

def test_interpretation_plot_q_ddpg_returns():
    data = MDPDataBunch.from_env('Pendulum-v0', render='human')
    # data = MDPDataBunch.from_env('MountainCarContinuous-v0', render='human')
    model = DDPG(data, batch=8)
    learn = AgentLearner(data, model)

    learn.fit(5)
    interp = AgentInterpretationAlpha(learn)
    interp.plot_heatmapped_episode(2)

コード例 #10

ファイルを表示

def test_epsilon():
    data = MDPDataBunch.from_env('maze-random-5x5-v0',
                                 render='human',
                                 max_steps=100,
                                 add_valid=False)
    model = FixedTargetDQN(data,
                           batch_size=64,
                           max_episodes=100,
                           copy_over_frequency=4)
    learn = AgentLearner(data, model)

    learn.fit(20)

コード例 #11

ファイルを表示

ファイル: test_ddpg_models.py プロジェクト: swelchm/fast-reinforcement-learning

def test_ddpg():
    data = MDPDataBunch.from_env('Pendulum-v0', render='human')
    # data = MDPDataBunch.from_env('MountainCarContinuous-v0', render='human')
    model = DDPG(data, batch=8)
    learn = AgentLearner(data, model)
    learn.fit(450)

コード例 #12

ファイルを表示

ファイル: test_agent_core.py プロジェクト: swelchm/fast-reinforcement-learning

def test_fit_function_ddpg():
    data = MDPDataBunch.from_env('Pendulum-v0', render='human', max_steps=1000)
    model = DDPG(data, memory=PriorityExperienceReplay(1000))
    learn = AgentLearner(data, model)
    learn.fit(5)