Exemplos de RandomWalk.Q_eps_greedy em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: randomwalk

Classe / Tipo: RandomWalk

Método / Função: Q_eps_greedy

Exemplos em hotexamples.com: 2

RandomWalk.Q_eps_greedy em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de randomwalk.RandomWalk.Q_eps_greedy em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

RandomWalk(30)

init(8)

fill_walk(6)

Q_equiprobable(6)

num_states(5)

value_equiprobable(4)

Q_eps_greedy(2)

value_to_Q(1)

take_walk(1)

start(1)

setWalk(1)

setLEDs(1)

make_sound(1)

num_actions(1)

make_plot(1)

fill_work(1)

fill_wall(1)

fill_rw(1)

export_walk(1)

walk(1)

Métodos Frequentes

RandomWalk (30)

init (8)

fill_walk (6)

Q_equiprobable (6)

num_states (5)

value_equiprobable (4)

Q_eps_greedy (2)

value_to_Q (1)

take_walk (1)

start (1)

Métodos Frequentes

setWalk (1)

setLEDs (1)

make_sound (1)

num_actions (1)

make_plot (1)

fill_work (1)

fill_wall (1)

fill_rw (1)

export_walk (1)

walk (1)

Exemplo n.º 1

0

Exibir arquivo

def example_randomwalk(): """ An example on random walk MDP """ # create an MDP env = RandomWalk(19, -1) # create n-step TreeBackup agent agent = TreeBackup(env, env.init(), 3) agent2 = TreeBackup(env, env.init(), 3) # act using equiprobable random policy with discount = 0.9 and step size = 0.1 num_episode = 1000 for iter in range(num_episode): agent.episode(0.9, 0.1) agent.init() agent2.set_policy_eps_greedy(0.1) for iter in range(num_episode): agent2.episode(0.9, 0.1) agent2.init() print('Q_DP[s][a] ', env.Q_equiprobable(0.9)) print('Q_eps_greedy[s][a] ', env.Q_eps_greedy(0.1, 0.9)) print('Equiprobable Q_TreeBackup[s][a]', agent.Q) print('Eps greedy Q_TreeBackup[s][a]', agent2.Q)

Exemplo n.º 2

0

Exibir arquivo

Arquivo: Qsigma.py Projeto: DZ9/qsigma

def example_randomwalk(): """ An example on random walk MDP """ # create an MDP env = RandomWalk(19, -1) # create n-step QSigma agent agent = QSigma(env, 0.5, env.init(), 3) #Psigma=0.5, init_state=env.init(), steps=3 agent2 = QSigma(env, 0.5, env.init(), 3) # act using equiprobable random policy with discount = 0.9 and step size = 0.1 num_episode = 1000 for iter in range(num_episode): agent.episode(0.9, 0.1) agent.init() agent2.set_policy_eps_greedy(0.1) for iter in range(num_episode): agent2.episode(0.9, 0.1) agent2.init() print('Q_DP[s][a] ', env.Q_equiprobable(0.9)) print('Q_eps_greedy[s][a] ', env.Q_eps_greedy(0.1, 0.9)) print('Equiprobable Q_Q(sigma)[s][a]', agent.Q) print('Eps greedy Q_Q(sigma)[s][a]', agent2.Q)