Esempi in Python per DQNAgent.train

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: agents.DQNAgent

Classe/tipologia: DQNAgent

Metodo/funzione: train

Esempi su hotexamples.com: 2

DQNAgent.train in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per agents.DQNAgent.DQNAgent.train, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

DQNAgent(12)

get_action(2)

train(2)

copy_weights(1)

predict(1)

take_action(1)

store_transition(1)

step(1)

save_weight(1)

save_reward(1)

save_action(1)

record_average_qvalue(1)

prob(1)

play(1)

create_checkpoint(1)

_render(1)

get_action_probabilities(1)

add_transition(1)

finish_nstep(1)

eval_step(1)

epsilon_by_step(1)

epsilon_by_frame(1)

epsilon(1)

learn(1)

Esempio n. 1

Mostra file

File: cartpole_DQN.py Progetto: KosmoJoe/reinforcementLearning

    Xdiscount = 0
    Xepsi = 0
    Xdec = 0
    rewards = []
    for j in learnRates:
        for k in discounts:
            for ep in epsi:
                for epdec in epsi_decay:
                    params = [episode_count, j, k, ep, epdec]
                    #params = [5000, 0.001,0.95, 1.1, 0.005]
                    #params = [5000, 0.0005,0.99, 0.1]
                    agent = DQNAgent(env.action_space, env.observation_space,
                                     params)

                    agent._render = False
                    rewardList, stepList = agent.train(env)
                    rewards.append(rewardList)
                    if reward < sum(rewards[-1]) / episode_count:
                        reward = sum(rewards[-1]) / episode_count
                        mytrainedAgent = agent
                        XlearnRate = j
                        Xdiscount = k
                        Xepsi = ep
                        Xdec = epdec
                    plt.plot(low_pass(rewardList),
                             label=("Test: " + str(params)))

    ## Train Agent
    #agent._render = False
    #rewardList, stepList =  agent.train(env)
    #agent.saveModel(agent.checkpointpath)

Esempio n. 2

Mostra file

File: deep_rl.py Progetto: nicoleorzan/emergent-communication

for ep in range(num_episodes):
    if (ep % 1000 == 0):
        print("episode=", ep)
        print("epsilon", sender.epsilon)

    obs = env.get_observation()
    mex = sender.take_action(obs)
    act = receiver.take_action(mex)
    rew = env.get_reward(obs, act)

    sender.store_transition(obs, mex, rew)
    receiver.store_transition(mex, act, rew)
    returns.append(rew)

    sender.train(ep)
    receiver.train(ep)

print("epsilon", sender.epsilon)
print("sender action probabilities")
for s in range(num_act):
    print(sender.get_action_probabilities(s))

print("receiver action probabilities")
for s in range(num_act):
    print(receiver.get_action_probabilities(s))

for s in range(num_act):
    plt.plot(np.linspace(0, num_act, num_act),
             sender.get_action_probabilities(s),
             label=str(s))