Esempi in Python per ValueIteration.valueIteration

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: ValueIteration

Classe/tipologia: ValueIteration

Metodo/funzione: valueIteration

Esempi su hotexamples.com: 4

ValueIteration.valueIteration in Python: 4 esempi trovati. Questi sono i migliori esempi reali in Python per ValueIteration.ValueIteration.valueIteration, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

ValueIteration(9)

valueIteration(4)

getQValues(2)

trial_run(2)

execute_policy(1)

getPolicy(1)

get_val(1)

iterate(1)

run(1)

runValueIteration(1)

set_utils(1)

solve(1)

trace_path(1)

value_iteration(1)

Esempio n. 1

Mostra file

File: TestValueIteration.py Progetto: Yun-Han/GridWorld-MDP

from GridWorld import GridWorld
from GridWorld import GridWorldAdditive
from ValueIteration import ValueIteration

# Run Value Iteration in different Grid World environments
if __name__ == "__main__":
    gamma = 0.9
    print("Grid world Value Iteration with discounted rewards gamma = %.2f\n" % gamma)
    terminals = {(0, 3): +1, (1, 3): -1}
    gw = GridWorld((3, 4), 0.8, [(1, 1)], terminals)
    vi = ValueIteration()
    values = vi.valueIteration(gw, gamma)
    gw.printValues(values)
    qvalues = vi.getQValues(gw, values, gamma)
    gw.printQValues(qvalues)
    policy = vi.getPolicy(gw, values, gamma)
    gw.printPolicy(policy)

    reward = -0.01
    print("Grid world Value Iteration with additive rewards = %.2f\n" % reward)
    gwa = GridWorldAdditive((3, 4), 0.8, [(1, 1)], terminals, reward)
    values = vi.valueIteration(gwa, 1, 100)
    gwa.printValues(values)
    qvalues = vi.getQValues(gwa, values, 1)
    gwa.printQValues(qvalues)
    policy = vi.getPolicy(gwa, values, 1)
    gwa.printPolicy(policy)
 
    reward = -0.04
    print("Grid World with additive rewards = %.2f\n" % reward)
    gwa = GridWorldAdditive((3, 4), 0.8, [(1, 1)], terminals, reward)

Esempio n. 2

Mostra file

File: Main.py Progetto: wuha5086/AIProjects

def VI_R_reset():
    VI = ValueIteration(0.00000000001, 0.5, "R", restart=True)
    VI.valueIteration(0.00000000001, 0.5)
    for i in range(10):
        print(VI.trial_run())

Esempio n. 3

Mostra file

File: Main.py Progetto: wuha5086/AIProjects

def ValueIteration_Rtest():
    VI = ValueIteration(0.00000000001, 0.5, "R")
    VI.valueIteration(0.00000000001, 0.5)
    for i in range(10):
        print(VI.trial_run())

Esempio n. 4

Mostra file

 def getQValues(self, env):
     vi = ValueIteration()
     values = vi.valueIteration(env)
     qvalues = vi.getQValues(env, values)
     return qvalues