Python AgentLearner.predict 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: fast_rl.core.Learner

클래스/타입: AgentLearner

메소드/함수: predict

hotexamples.com에서의 예제들: 2

Python AgentLearner.predict - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 fast_rl.core.Learner.AgentLearner.predict에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

AgentLearner(12)

fit(10)

predict(2)

자주 사용되는 메소드들

AgentLearner (12)

fit (10)

predict (2)

예제 #1

파일 보기

def test_interpretation_heatmap():
    data = MDPDataBunch.from_env('maze-random-5x5-v0', render='human')
    model = DQN(data)
    learn = AgentLearner(data, model)

    epochs = 10

    callbacks = learn.model.callbacks  # type: Collection[LearnerCallback]
    [c.on_train_begin(learn=learn, n_epochs=epochs) for c in callbacks]
    for epoch in range(epochs):
        [c.on_epoch_begin(epoch=epoch) for c in callbacks]
        learn.model.train()
        for element in learn.data.train_dl:
            learn.data.train_ds.actions = learn.predict(element)
            [c.on_step_end(learn=learn) for c in callbacks]
        [c.on_epoch_end() for c in callbacks]

        # For now we are going to avoid executing learner_callbacks here.
        learn.model.eval()
        for element in learn.data.valid_dl:
            learn.data.valid_ds.actions = learn.predict(element)

        if epoch % 1 == 0:
            interp = AgentInterpretationAlpha(learn)
            interp.plot_heatmapped_episode(epoch)
    [c.on_train_end() for c in callbacks]

예제 #2

파일 보기

def test_interpretation_plot_sequence():
    data = MDPDataBunch.from_env('maze-random-5x5-v0',
                                 render='human',
                                 max_steps=1000)
    model = DQN(data)
    learn = AgentLearner(data, model)

    epochs = 20

    callbacks = learn.model.callbacks  # type: Collection[LearnerCallback]
    [c.on_train_begin(learn=learn, n_epochs=epochs) for c in callbacks]
    for epoch in range(epochs):
        [c.on_epoch_begin(epoch=epoch) for c in callbacks]
        learn.model.train()
        counter = 0
        for element in learn.data.train_dl:
            learn.data.train_ds.actions = learn.predict(element)
            [c.on_step_end(learn=learn) for c in callbacks]

            counter += 1
            # if counter % 100 == 0:# or counter == 0:
        interp = AgentInterpretationAlpha(learn, ds_type=DatasetType.Train)
        interp.plot_heatmapped_episode(epoch)

        [c.on_epoch_end() for c in callbacks]
    [c.on_train_end() for c in callbacks]