Ejemplos de Framework.update_cache en Python

Lenguaje de programación: Python

Namespace/Package Name: agent.framework

Clase / Tipo: Framework

Método / Función: update_cache

Ejemplos en hotexamples.com: 2

Python Framework.update_cache - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de agent.framework.Framework.update_cache extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Framework(6)

get_deterministic_policy(2)

get_losses(2)

get_stochastic_action(2)

train_step(2)

update_cache(2)

update_value_net(2)

get_step_value(1)

get_stochastic_policy(1)

get_value(1)

init_network(1)

init_or_update_local(1)

update_target_net(1)

Ejemplo n.º 1

Mostrar archivo

class Agent(object):
    def __init__(self):
        self.agent = Framework()

        config = tf.ConfigProto()
        config.gpu_options.allow_growth = True
        self.sess = tf.Session(config=config)
        self.saver = tf.train.Saver()
        self.sess.run(tf.global_variables_initializer())
        self.sess.graph.finalize()

    def get_deterministic_policy(self, inputs):
        return self.agent.get_deterministic_policy(self.sess, inputs)

    def get_stochastic_policy(self, inputs, epsilon=0.9):
        return self.agent.get_stochastic_policy(self.sess, inputs, epsilon)

    def update_cache(self, state, action, reward, next_state, done):
        self.agent.update_cache(state, action, reward, next_state, done)

    def update_eval(self):
        self.agent.update_value_net(self.sess)

    def update_target(self):
        self.agent.update_target_net(self.sess)

    def save_model(self, path="model/ddqn.ckpt"):
        self.saver.save(self.sess, path)

    def restore_model(self, path="model/ddqn.ckpt"):
        self.saver.restore(self.sess, path)

    def close(self):
        self.sess.close()

Ejemplo n.º 2

Mostrar archivo

import numpy as np
import tensorflow as tf
from agent.framework import Framework
from emulator_v0.main import Account

A = Account()
F = Framework()
# print(len(tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES)))
state, universe = A.reset()

sess = tf.Session()
sess.run(tf.global_variables_initializer())

order = F.get_deterministic_policy(sess, state)
next_state, next_universe, reward, done, value, portfolio = \
    A.step(order, universe)

for i in range(2048):
    F.update_cache(state, order, reward, next_state, done)

F.update_value_net(sess)