Esempi in Python per Learner.replay

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: Learner

Classe/tipologia: Learner

Metodo/funzione: replay

Esempi su hotexamples.com: 1

Learner.replay in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per Learner.Learner.replay, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Learner(30)

__init__(4)

fit(3)

obj_from_file(3)

gen_instances(3)

gen_X_matrix(3)

learn(3)

getLastAction(2)

run(2)

feature_selection(2)

reward(2)

chooseAction(2)

getContext(2)

load(2)

process_query(1)

predict(1)

prepare_data(1)

process_accept(1)

euclidean_distance(1)

query_others(1)

random_exploration(1)

replay(1)

parameters(1)

reset(1)

reward_tst_data(1)

plot_correlation_heatmap(1)

look(1)

add_memory(1)

mutateProgram(1)

model_songs(1)

evaluate_predicated(1)

log(1)

categorize_songs_probab(1)

j_data(1)

i_data(1)

get_targets(1)

get_reward(1)

decide(1)

forward(1)

destroy(1)

execute(1)

save(1)

Esempio n. 1

Mostra file

File: inverted_pendulum.py Progetto: afcarl/python-mujoco

                _, _, errors = learner.get_targets([(0, (state, action, reward,
                                                         new_state, done))])
                learner.add_memory(errors[0],
                                   (state, action, reward, new_state, done))

                state = new_state

                if done or step == max_steps - 1:
                    score_list.append(step)
                    break

            # Decay the epsilon
            if actor.epsilon > actor.epsilon_min:
                actor.epsilon *= actor.epsilon_decay

        print("Episode: {}, Score: {}/{}".format(
            e,
            sum(score_list) / len(score_list), max_steps - 1))
        scores.append(sum(score_list) / len(score_list))
        x = range(len(scores))
        y = scores

        learner.replay()
        plt.scatter(x[-1], y[-1])
        plt.pause(0.05)

        if e % 25 == 0:
            learner.update_target()

    learner.save_model('./models/inverted_pendulum_v0.2.h5')