Esempi in Python per EpsilonGreedyPolicy

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: policies

Classe/tipologia: EpsilonGreedyPolicy

Esempi su hotexamples.com: 1

EpsilonGreedyPolicy in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per policies.EpsilonGreedyPolicy, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

EpsilonGreedyPolicy(12)

select_action(4)

act(1)

action(1)

random_action(1)

update_epsilon(1)

Esempio n. 1

Mostra file

e0 = 0.90
e1 = 0.10
decay_fun = sch_exp_decay
cos_ann = True
ann_cyc = 5

schedule = Schedule(t0,
                    t1,
                    e0,
                    e1,
                    decay_fun,
                    cosine_annealing=cos_ann,
                    annealing_cycles=ann_cyc)

# Policy
policy = EpsilonGreedyPolicy(schedule=schedule, value_function=Q)

# Reward Function
reward_fun = rf_info2d_pos

# Action Pre/Post-Processing Action
act_fun = act_disc2cont

# Agent
lr = 1e-4
gamma = 0.99
doubleQ = True  # Run doubleQ-DQN sampling from Q_target and bootstraping from Q
rb = True
rb_max_size = 1e6
rb_batch_size = 64
tau = 0.1