Esempi in Python per DQNAgent.act_test

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: DQN

Classe/tipologia: DQNAgent

Metodo/funzione: act_test

Esempi su hotexamples.com: 2

DQNAgent.act_test in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per DQN.DQNAgent.act_test, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

DQNAgent(30)

epsilon(27)

remember(27)

replay_new(26)

train_short_memory(25)

set_reward(24)

get_state(24)

save(8)

train(6)

replay(3)

load(3)

act(3)

el_mejor_estado(2)

parameters(2)

act_test(2)

state_dict(2)

update_replay_memory(2)

step(2)

optimizer(2)

get_action(2)

update(2)

get_move(2)

to(2)

store_transition(1)

target_train(1)

test_agent(1)

train_policy(1)

train_model(1)

possible_moves(1)

save_model(1)

replay_memory(1)

predict(1)

player(1)

memoize(1)

loss_avg(1)

learn(1)

get_reward(1)

get_qs(1)

consider(1)

choose_action(1)

best_state(1)

add_memoria(1)

update_target_model(1)

Esempio n. 1

Mostra file

File: Environment_hyperparameter.py Progetto: sunhemeng/master-thesis

                states = np.reshape(states, [1, state_size])
                action = QN.act(states)
                next_state, rewards, overall_err = sim_env.Assign_Cores(action)
                next_state = np.reshape(next_state, [1, state_size])
                QN.remember(states, action, rewards, next_state)
                states = next_state
                if len(QN.memory) > batch_size:
                    QN.replay(batch_size)

            loss_overall = np.append(loss_overall, QN.loss_avg/training)
            QN.loss_avg = 0

            sim_env.reset()
            for u in range(testing):
                states = np.reshape(states, [1, state_size])
                action = QN.act_test(states)
                # print('SNR:', sim_env.SNR[-1])
                # print('action:', sim_env.action[action])
                next_state, rewards, overall_err = sim_env.Assign_Cores(action)
                error = np.append(error, overall_err)
                next_state = np.reshape(next_state, [1, state_size])
                states = next_state
            print(e)
            print(sim_env.error/testing)
            error_avg = np.append(error_avg, np.power(10, -sim_env.error/testing))

        # Save Error and Losses in CSV file, Save weights of networks ####
        parameters = '_DQN_S{}_rho{}_SNR{}_PS{}_lr{}_df{}_sl{}_nhl{}_ef{}'.\
            format(sim_env.S, sim_env.p, sim_env.SNR_avg[0], sim_env.pi, QN.learning_rate,
                    QN.gamma, QN.size_layers, QN.number_hidden_layers, QN.epsilon_decay)
        print(parameters)

Esempio n. 2

Mostra file

File: env_loadNet_test.py Progetto: sunhemeng/master-thesis

    print(r)
    parameters = 'old/DQN__S{}_rho{}_SNR{}_PS{}_W4_lr0.0001_df0.0_sl24_nhl1_ef0.9'.format(
        r, 0.9, SNR, sim_env.pi)
    QN.load(sim_env.channel_type + '/' + parameters)
    sim_env = Simulation(number_of_servers=num_of_servers,
                         number_of_users=1,
                         historic_time=hist_timeslots,
                         snr_set=avg_SNR,
                         csi=0,
                         channel=0.9)
    sim_env.reset()
    states = sim_env.state  # get first state
    for u in range(testing):
        states = np.reshape(
            states, [1, state_size])  # reshape state to vector for network
        action = QN.act_test(states)  # get action from DQN agent
        # print('SNR:', sim_env.SNR[-1])
        # print('action:', sim_env.action[action])
        next_state, rewards, overall_err = sim_env.Assign_Cores(
            action, u)  # get next state, reward and error
        error = np.append(error, overall_err)
        next_state = np.reshape(next_state,
                                [1, state_size])  # reshape next state
        states = next_state  # state = next state
    print(r)
    print(np.power(10, -sim_env.error / testing))
    error_avg = np.append(error_avg, np.power(10, -sim_env.error / testing))

# Save Error and Losses in CSV file, Save weights of networks ####
parameters = 'DQN_S{}_rho{}_SNR{}_PS{}_OverMaxBlkL'.format(
    sim_env.S, sim_env.p, sim_env.SNR_avg[0], sim_env.pi)