Exemplos de QNetwork.items em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: model

Classe / Tipo: QNetwork

Método / Função: items

Exemplos em hotexamples.com: 2

QNetwork.items em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de model.QNetwork.items em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

QNetwork(30)

eval(30)

train(30)

state_dict(30)

load_state_dict(30)

parameters(30)

forward(23)

to(8)

set_weights(6)

cuda(5)

get_weights(4)

sample_action(3)

cpu(3)

save_weights(2)

load_weights(2)

decide_action(2)

load_model(2)

items(2)

criterion(2)

trainNet(1)

backward(1)

step(1)

update_mean(1)

spectrum(1)

update_nn(1)

update_target_network(1)

soft_update(1)

restore(1)

set_params(1)

save(1)

sample_actions(1)

qvalue(1)

predict_act(1)

__str__(1)

named_parameters(1)

loss_fn(1)

load(1)

initialize_weights(1)

get_action(1)

foward(1)

update_weights(1)

Métodos Frequentes

QNetwork (30)

eval (30)

train (30)

state_dict (30)

load_state_dict (30)

parameters (30)

forward (23)

to (8)

set_weights (6)

cuda (5)

Métodos Frequentes

get_weights (4)

sample_action (3)

cpu (3)

save_weights (2)

load_weights (2)

decide_action (2)

load_model (2)

items (2)

criterion (2)

trainNet (1)

backward (1)

step (1)

update_mean (1)

spectrum (1)

update_nn (1)

update_target_network (1)

soft_update (1)

restore (1)

set_params (1)

save (1)

Métodos Frequentes

backward (1)

step (1)

update_mean (1)

spectrum (1)

update_nn (1)

update_target_network (1)

soft_update (1)

restore (1)

set_params (1)

save (1)

sample_actions (1)

qvalue (1)

predict_act (1)

__str__ (1)

named_parameters (1)

loss_fn (1)

load (1)

initialize_weights (1)

get_action (1)

foward (1)

update_weights (1)

Métodos Frequentes

sample_actions (1)

qvalue (1)

predict_act (1)

__str__ (1)

named_parameters (1)

loss_fn (1)

load (1)

initialize_weights (1)

get_action (1)

foward (1)

update_weights (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: test.py Projeto: wmylxmj/DIY-Barrage-Game-Environment-For-DRL-Researching

tf.reset_default_graph() # 输入 X = tf.placeholder(tf.float32, shape=input_shape) in_training_mode = tf.placeholder(tf.bool) # Q网络 mainQ_weights, mainQ_outputs = QNetwork(X, nActions, nameScope='mainQ') targetQ_weights, targetQ_outputs = QNetwork(X, nActions, nameScope='targetQ') # 行为Q X_action = tf.placeholder(tf.int32, shape=(None, )) Q_action = tf.reduce_sum(targetQ_outputs*tf.one_hot(X_action, nActions), axis=-1, keep_dims=True) # 权重复制 copy_op = [tf.assign(main_name, targetQ_weights[var_name]) for var_name, main_name in mainQ_weights.items()] copy_target_to_main = tf.group(*copy_op) # 输出 y = tf.placeholder(tf.float32, shape=(None, 1)) # 损失 loss = tf.reduce_mean(tf.square(y - Q_action)) # 预处理器 state_preprocessor = StatePreprocessor(nFrames=nFrames, shape=frame_shape) # tensorflow会话 saver = tf.train.Saver() with tf.Session() as sess: saver.restore(sess, weights)

Exemplo n.º 2

0

Exibir arquivo

Arquivo: train.py Projeto: wmylxmj/DIY-Barrage-Game-Environment-For-DRL-Researching

in_training_mode = tf.placeholder(tf.bool) # Q网络 mainQ_weights, mainQ_outputs = QNetwork(X, nActions, nameScope='mainQ') targetQ_weights, targetQ_outputs = QNetwork(X, nActions, nameScope='targetQ') # 行为Q X_action = tf.placeholder(tf.int32, shape=(None, )) Q_action = tf.reduce_sum(targetQ_outputs * tf.one_hot(X_action, nActions), axis=-1, keep_dims=True) # 权重复制 copy_op = [ tf.assign(main_name, targetQ_weights[var_name]) for var_name, main_name in mainQ_weights.items() ] copy_target_to_main = tf.group(*copy_op) # 输出 y = tf.placeholder(tf.float32, shape=(None, 1)) # 损失 loss = tf.reduce_mean(tf.square(y - Q_action)) # 优化器 optimizer = tf.train.AdamOptimizer(learning_rate) training_op = optimizer.minimize(loss) # 日志 loss_summary = tf.summary.scalar('loss', loss)