Python DQN_Agent.train Exemples

Langage de programmation: Python

Espace de nommage/Pack: agent.DQN

Class/Type: DQN_Agent

Méthode/Fonction: train

Exemples au hotexamples.com: 2

Python DQN_Agent.train - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de agent.DQN.DQN_Agent.train extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

DQN_Agent(2)

test(2)

train(2)

backward(1)

forward(1)

load_weights(1)

save_weights(1)

Méthodes fréquemment utilisées

DQN_Agent (2)

test (2)

train (2)

backward (1)

forward (1)

load_weights (1)

save_weights (1)

Exemple #1

0

Afficher le fichier

Fichier : RUN_mountaincar_with_DQN.py Projet : zachkeer/Torch-rl

import gym import time from agent.DQN import DQN_Agent from model.Network import DenseNet from torch import nn from common.Policy_for_DQN import EpsGreedyQPolicy #%% envID = "MountainCar-v0" env = gym.make(envID) nowtime = time.strftime('%y%m%d%H%M', time.localtime()) path = "savedate" + '/' + envID + "-dqn-" + nowtime + '/' #%% policy = EpsGreedyQPolicy() model = DenseNet(env.observation_space.shape[0], env.action_space.n, hidden_activate=nn.Tanh()) Agent = DQN_Agent(env, model, policy, gamma=0.90, lr=1e-3, path=path) Agent.train(max_step=100000, render=True, verbose=2) Agent.save_weights(path) Agent.test(max_step=10000, render=True, verbose=2)

Exemple #2

0

Afficher le fichier

Fichier : RUN_Catrpole_with_DQN.py Projet : Seugit/Torch-rl

import gym import time from agent.DQN import DQN_Agent from model.Network import DenseNet from torch import nn from common.Policy_for_DQN import BoltzmannQPolicy #%% envID = "CartPole-v0" env = gym.make(envID) nowtime = time.strftime('%y%m%d%H%M', time.localtime()) path = "savedate" + '/' + envID + "dqn" + nowtime + '/' #%% policy = BoltzmannQPolicy() model = DenseNet(env.observation_space.shape[0], env.action_space.n, hidden_activate=nn.Tanh()) Agent = DQN_Agent(env, model, policy, gamma=0.99, lr=1e-3, path=path) Agent.train(max_step=100000, render=False, verbose=2) Agent.test(max_step=10000, render=False, verbose=2)