Ejemplos de ReplayBuffer.number_of_samples en Python

Lenguaje de programación: Python

Namespace/Package Name: common.replay_buffer

Clase / Tipo: ReplayBuffer

Método / Función: number_of_samples

Ejemplos en hotexamples.com: 2

Python ReplayBuffer.number_of_samples - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de common.replay_buffer.ReplayBuffer.number_of_samples extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

ReplayBuffer(30)

sample(18)

add(9)

sample_batch(5)

load(3)

push(3)

number_of_samples(2)

make_index(1)

sample_index(1)

show(1)

size(1)

Ejemplo n.º 1

Mostrar archivo

        }
        session.run(train_op, feed_dict)
        session.run(target_update)
        return session.run(q_loss, feed_dict)


# %% main loop
losses = []
returns = []

for n in range(ITERATIONS):
    epsilon = 1.0 / np.sqrt(n + 1)
    steps, total_return = play_once(env, epsilon)

    returns.append(total_return)
    if MINIMAL_SAMPLES < replay_buffer.number_of_samples():
        loss = train()
        losses.append(loss)

    if n != 0 and n % 10 == 0:
        print("Episode:", n, "Returns:", total_return, "epsilon:", epsilon)

#%% Demo

filename = os.path.basename(__file__).split('.')[0]
monitor_dir = './' + filename + '_' + str(datetime.now())
env = gym.wrappers.Monitor(env, monitor_dir)
for n in range(DEMO_NUMBER):
    play_once(env, 0.0, render=True)

# %%Close Environment

Ejemplo n.º 2

Mostrar archivo

Archivo: cart_pole_dqn_pytorch.py Proyecto: ouj/RL


def demo():
    demo_env = gym.wrappers.Monitor(env,
                                    MONITOR_DIR,
                                    resume=True,
                                    mode="evaluation",
                                    write_upon_reset=True)
    steps, total_return = play_once(demo_env, 0.05, render=True)
    print("Demo for %d steps, Return %d" % (steps, total_return))


# Populate replay buffer
epsilon = 1.0
print("Populating replay buffer with epsilon %f..." % epsilon)
while MINIMAL_SAMPLES > replay_buffer.number_of_samples():
    steps, total_return = play_once(env, epsilon, render=False)
    print("Played %d < %d steps" %
          (replay_buffer.number_of_samples(), MINIMAL_SAMPLES))

# Main loop
print("Start Main Loop...")
n = 0.5
for n in range(ITERATIONS):
    epsilon = 1.0 / np.sqrt(n + 1)
    steps, total_return = play_once(env, epsilon)

    t0 = datetime.now()
    for _ in range(steps):
        train()
        global_step += 1