Ejemplos de QNetwork.update_nn en Python

Lenguaje de programación: Python

Namespace/Package Name: model

Clase / Tipo: QNetwork

Método / Función: update_nn

Ejemplos en hotexamples.com: 1

Python QNetwork.update_nn - 1 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de model.QNetwork.update_nn extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

QNetwork(30)

eval(30)

train(30)

state_dict(30)

load_state_dict(30)

parameters(30)

forward(23)

to(8)

set_weights(6)

cuda(5)

get_weights(4)

sample_action(3)

cpu(3)

save_weights(2)

load_weights(2)

decide_action(2)

load_model(2)

items(2)

criterion(2)

trainNet(1)

backward(1)

step(1)

update_mean(1)

spectrum(1)

update_nn(1)

update_target_network(1)

soft_update(1)

restore(1)

set_params(1)

save(1)

sample_actions(1)

qvalue(1)

predict_act(1)

__str__(1)

named_parameters(1)

loss_fn(1)

load(1)

initialize_weights(1)

get_action(1)

foward(1)

update_weights(1)

Ejemplo n.º 1

Mostrar archivo

                            train_batch = exp_buffer.sample(batch_size)

                            pred_act, _ = main_qn.predict_act(
                                np.vstack(train_batch[:, 3]), batch_size, sess)
                            _, q_vals = target_qn.predict_act(
                                np.vstack(train_batch[:, 3]), batch_size, sess)

                            end_multiplier = -(train_batch[:, 4] - 1)
                            double_q = q_vals[range(batch_size), pred_act]
                            target_q_val = train_batch[:,
                                                       2] + gamma * double_q * end_multiplier

                            in_frames = np.vstack(train_batch[:, 0])
                            acts = train_batch[:, 1]
                            main_qn.update_nn(in_frames, target_q_val, acts,
                                              batch_size, sess, summ_writer,
                                              step_value)
                            step_value = sess.run(inc_global_step)

                    s = s1
                    s_frame = s1_frame

                ep_rewards.append(reward)
                total_step += 1

                if total_step % update_target_step == 0:
                    sess.run(update_qn_op)

                if done:
                    disc_r = discounted_reward(ep_rewards, gamma)
                    score = discounted_reward(ep_rewards, 1)