Python DQN.fit 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: d3rlpy.algos

클래스/타입: DQN

메소드/함수: fit

hotexamples.com에서의 예제들: 6

Python DQN.fit - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 d3rlpy.algos.DQN.fit에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

DQN(29)

fit_online(9)

fit(6)

build_with_env(4)

fit_batch_online(4)

predict(4)

save_model(2)

collect(1)

create_impl(1)

예제 #1

파일 보기

def test_compare():
    dataset, _ = get_cartpole()
    train_episodes = dataset.episodes[:10]
    test_episodes = dataset.episodes[-10:]

    algo = DQN(n_epochs=1)
    algo.fit(train_episodes, logdir='test_data')

    base_algo = DQN(n_epochs=1)
    base_algo.fit(train_episodes, logdir='test_data')

    score = _compare(algo, base_algo, test_episodes, True)

예제 #2

파일 보기

def test_evaluate():
    dataset, _ = get_cartpole()
    train_episodes = dataset.episodes[:10]
    test_episodes = dataset.episodes[-10:]

    algo = DQN(n_epochs=1)
    algo.fit(train_episodes, logdir='test_data')

    scores = _evaluate(algo, test_episodes, True)

    eval_keys = [
        'td_error', 'advantage', 'average_value', 'value_std', 'action_match'
    ]

    for key in eval_keys:
        assert key in scores

예제 #3

파일 보기

def main(args):
    dataset, env = get_atari(args.dataset)

    d3rlpy.seed(args.seed)

    train_episodes, test_episodes = train_test_split(dataset, test_size=0.2)

    dqn = DQN(
        n_frames=4,  # frame stacking
        q_func_type=args.q_func_type,
        scaler='pixel',
        use_gpu=args.gpu)

    dqn.fit(train_episodes,
            eval_episodes=test_episodes,
            n_epochs=100,
            scorers={
                'environment': evaluate_on_environment(env, epsilon=0.05),
                'td_error': td_error_scorer,
                'discounted_advantage': discounted_sum_of_advantage_scorer,
                'value_scale': average_value_estimation_scorer
            })

예제 #4

파일 보기

파일: train_dqn.py 프로젝트: tandakun/d3rlpy

def main(args):
    dataset, env = get_atari(args.dataset)

    d3rlpy.seed(args.seed)

    train_episodes, test_episodes = train_test_split(dataset, test_size=0.2)

    device = None if args.gpu is None else Device(args.gpu)

    dqn = DQN(n_epochs=100,
              q_func_type=args.q_func_type,
              scaler='pixel',
              use_batch_norm=False,
              use_gpu=device)

    dqn.fit(train_episodes,
            eval_episodes=test_episodes,
            scorers={
                'environment': evaluate_on_environment(env, epsilon=0.05),
                'td_error': td_error_scorer,
                'discounted_advantage': discounted_sum_of_advantage_scorer,
                'value_scale': average_value_estimation_scorer
            })

예제 #5

파일 보기

파일: train_dqn.py 프로젝트: kintatta/d3rl

from d3rlpy.algos import DQN
from d3rlpy.datasets import get_cartpole
from d3rlpy.metrics.scorer import evaluate_on_environment

# obtain dataset
dataset, env = get_cartpole()

# setup algorithm
dqn = DQN(n_epochs=1)

# train
dqn.fit(dataset.episodes)

# evaluate trained algorithm
evaluate_on_environment(env, render=True)(dqn)

예제 #6

파일 보기

파일: train_dqn.py 프로젝트: wx-b/d3rlpy

from d3rlpy.algos import DQN
from d3rlpy.datasets import get_cartpole
from d3rlpy.metrics.scorer import evaluate_on_environment

# obtain dataset
dataset, env = get_cartpole()

# setup algorithm
dqn = DQN()

# train
dqn.fit(dataset.episodes, n_epochs=1)

# evaluate trained algorithm
evaluate_on_environment(env, render=True)(dqn)