Python GridworldGui.value_iteration示例

编程语言: Python

命名空间/包名称: gridworld.gridworldgui

类/类型: GridworldGui

方法/功能: value_iteration

hotexamples.com的示例: 2

Python GridworldGui.value_iteration - 已找到2个示例。这些是从开源项目中提取的最受好评的gridworld.gridworldgui.GridworldGui.value_iteration现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

GridworldGui(2)

nfeatures(2)

phi(2)

trace(2)

background(1)

follow(1)

linear_policy(1)

mainloop(1)

set_arrows(1)

value_iteration(1)

示例#1

显示文件

文件： test_solution_methods.py 项目： stober/gridworld

endstates = [32, 2016, 1024, 1040, 1056, 1072]
gw = GridworldGui(nrows=32,ncols=64,endstates=endstates, walls=[])

#gw.updategui=False
#gw.draw_state_labels()

#learner = TDQ(8,81,0.1,0.9,0.9)
#learner = TD(81,0.1,0.9,0.9)
#learner = Sarsa(8,81, 0.3, 0.9,0.9, 0.4)
learner = SampleModelValueIteration(8,81)

# rw_model, transition_model
# pdb.set_trace()
# v,pi = learner.learn(100,gw,verbose=True)

v,pi = gw.value_iteration()
#pi = np.ones(gw.nstates,dtype='int')

#vals = { s : learner.value(s) for s in range(gw.nstates) }
#print vals
#gw.draw_values(vals)

# for s in range(gw.nstates):
#     a = learner.best(s)
#     pi[s] = learner.best(s)

# gw.redraw()

# for i in gw.sindices:
#     pi[i] = i % 8
gw.set_arrows(pi)

示例#2

显示文件

endstates = [32, 2016, 1024, 1040, 1056, 1072]
gw = GridworldGui(nrows=32, ncols=64, endstates=endstates, walls=[])

#gw.updategui=False
#gw.draw_state_labels()

#learner = TDQ(8,81,0.1,0.9,0.9)
#learner = TD(81,0.1,0.9,0.9)
#learner = Sarsa(8,81, 0.3, 0.9,0.9, 0.4)
learner = SampleModelValueIteration(8, 81)

# rw_model, transition_model
# pdb.set_trace()
# v,pi = learner.learn(100,gw,verbose=True)

v, pi = gw.value_iteration()
#pi = np.ones(gw.nstates,dtype='int')

#vals = { s : learner.value(s) for s in range(gw.nstates) }
#print vals
#gw.draw_values(vals)

# for s in range(gw.nstates):
#     a = learner.best(s)
#     pi[s] = learner.best(s)

# gw.redraw()

# for i in gw.sindices:
#     pi[i] = i % 8
gw.set_arrows(pi)