Exemplos de DQNAgent.forward em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: rl.agents

Classe / Tipo: DQNAgent

Método / Função: forward

Exemplos em hotexamples.com: 2

DQNAgent.forward em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de rl.agents.DQNAgent.forward em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

DQNAgent(30)

compile(30)

fit(22)

save_weights(17)

test(16)

load_weights(10)

forward(2)

pre_train(2)

remember(2)

replay_new(1)

train_short_memory(1)

set_reward(1)

model_name(1)

replay(1)

act(1)

get_state(1)

epsilon(1)

backward(1)

update_target_model(1)

Métodos Frequentes

DQNAgent (30)

compile (30)

fit (22)

save_weights (17)

test (16)

load_weights (10)

forward (2)

pre_train (2)

remember (2)

replay_new (1)

Métodos Frequentes

train_short_memory (1)

set_reward (1)

model_name (1)

replay (1)

act (1)

get_state (1)

epsilon (1)

backward (1)

update_target_model (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: agent.py Projeto: amaurySabran/TrackMaster

class DqnAgent(Agent): def __init__(self, env: gym.Env, memory=SequentialMemory(limit=50000, window_length=1), logger=Logger(), boxes_resolution=10, nb_steps_warmup=20, hidden_layers=[16, 16, 16], policy=BoltzmannQPolicy(), target_model_update=1e-2, optimizer=Adam(lr=1e-3)): self.env = env if isinstance(boxes_resolution, int): boxes_resolution = (boxes_resolution, ) * len( env.action_space.shape) self.boxes_resolution = boxes_resolution self.nb_actions = np.zeros(boxes_resolution).size model = Sequential() model.add(Flatten(input_shape=(1, ) + env.observation_space.shape)) # TODO check this for l in hidden_layers: model.add(Dense(l, activation='relu')) model.add(Dense(self.nb_actions, activation='linear')) # TODO move this to util file? self.model = model print("dqn model summary :{0}".format(model.summary())) self.dqn = DQNAgent(model=model, nb_actions=self.nb_actions, memory=memory, nb_steps_warmup=nb_steps_warmup, target_model_update=target_model_update, policy=policy, processor=DqnProcessor(self.boxes_resolution, env.action_space.low, env.action_space.high)) self.dqn.compile(optimizer=optimizer, metrics=['mae']) super().__init__(env, logger) def act(self, state, explore): action = self.dqn.processor.process_action(self.dqn.forward(state)) return action def train(self, nb_episodes=1000, verbose=2, visualize=True): self.dqn.fit(env=self.env, nb_steps=nb_episodes, verbose=verbose, visualize=visualize)

Exemplo n.º 2

0

Exibir arquivo

class KerasDQNAgent(Agent): """ Wrapper on Keras DQN agent """ _internal_agent: DQNAgent def __init__(self) -> None: super().__init__() def set_num_states(self, state_dimension: int, num_actions: int) -> None: model = self._build_model(state_dimension, num_actions) memory = SequentialMemory(limit=10000, window_length=1) self._internal_agent = DQNAgent(model=model, nb_actions=num_actions, memory=memory, nb_steps_warmup=1000, target_model_update=1000, gamma=0.99, delta_clip=1) self._internal_agent.compile(Adam(lr=0.0001), metrics=['mae']) def act(self, state: StateT) -> int: return self._internal_agent.forward(state) def update(self, state: StateT, action: int, reward: float, new_state: StateT) -> None: self._internal_agent.backward() def _build_model(self, state_dimension: int, num_actions: int) -> Sequential: model = Sequential() model.add( Dense(units=64, input_shape=(1, state_dimension), activation='relu')) model.add(Dense(units=64, activation='relu')) model.add(Flatten()) model.add(Dense(num_actions, activation='softmax')) return model