Esempi in Python per ExperienceReplay.load

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: experience_replay

Classe/tipologia: ExperienceReplay

Metodo/funzione: load

Esempi su hotexamples.com: 2

ExperienceReplay.load in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per experience_replay.ExperienceReplay.load, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

ExperienceReplay(27)

sample(12)

add(9)

append(5)

get_batch(3)

save(2)

sample_mini_batch(2)

get_random_minibatch(2)

load(2)

remember(1)

stop(1)

start(1)

sort(1)

size(1)

set_epsilon(1)

insert(1)

push(1)

init_replay_buffer(1)

get_num(1)

extract(1)

add_experinces(1)

add_experince(1)

add_experience(1)

add_column(1)

addExperience(1)

update_priorities(1)

Esempio n. 1

Mostra file

gameDisplay = pygame.display.set_mode(DISPLAY_SHAPE)
pygame.display.set_caption('Bouncing Balls')
pygame.key.set_repeat(1, 1)

env = GameEnvironment(DISPLAY_SHAPE, 1.0 / float(FPS))


def action_vector(a):
    res = np.zeros(9)
    res[int(a)] = 1.0
    return res


# Define Experience Replay
if SAVE_EXPERIENCE:
    er = ExperienceReplay.load(EXP_REPLAY_FILE)
    if er == None:
        er = ExperienceReplay(BUFFER_SIZE)


def gameover(hero_score):

    gameDisplay.fill(WHITE)

    font = pygame.font.SysFont(None, 42)
    text = font.render("GAME OVER", True, BLACK)
    gameDisplay.blit(text, (DISPLAY_SHAPE[0] / 3, DISPLAY_SHAPE[1] / 3))

    pygame.display.update()

    pygame.time.delay(3000)

Esempio n. 2

Mostra file

File: qlearning.py Progetto: tailongnguyen/dd_qnet

import sys
import os
from ddq_model import Qnet
from experience_replay import ExperienceReplay
from utils import Config

argv = sys.argv[1:]
config = Config(argv)
env = gym.make('GazeboTurtlebotMazeColor-v0')
replay = ExperienceReplay(config.args.output_dir,
                          config.args.replay_buffer_size)
qnet = Qnet(env.num_state, env.num_action)

if (config.args.continue_from != None):
    qnet.load(config.args.continue_from)
    replay.load(config.args.continue_from)

elif (config.args.from_pretrain != None):
    qnet.load(config.args.from_pretrain)

epsilon = config.args.start_epsilon
epsilon_decay = (config.args.start_epsilon -
                 config.args.end_epsilon) / config.args.annealing_steps

while True:
    state = env.reset()
    replay_ep = ExperienceReplay(config.args.output_dir,
                                 config.args.replay_buffer_size)
    total_reward = 0
    num_random_step = 0
    start_step = config.total_step