Python Gridworld.default_grid示例

编程语言: Python

命名空间/包名称: gridworld

类/类型: Gridworld

方法/功能: default_grid

hotexamples.com的示例: 4

Python Gridworld.default_grid - 已找到4个示例。这些是从开源项目中提取的最受好评的gridworld.Gridworld.default_grid现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Gridworld(20)

default_grid(4)

apply_action(2)

is_goal(2)

__init__(1)

add_agent(1)

add_goal(1)

current(1)

draw_frame(1)

draw_state_labels(1)

get_all_states(1)

get_current_state(1)

get_random_state(1)

get_state(1)

make_video(1)

示例#1

显示文件

文件： monte_carlo.py 项目： Gistbatch/Reinforcement

def simple_example():
    grid = Gridworld.default_grid()
    print('Rewards:')
    print_values(grid.rewards, grid)
    policy = {
        (2, 0): 'U',
        (1, 0): 'U',
        (0, 0): 'R',
        (0, 1): 'R',
        (0, 2): 'R',
        (1, 2): 'R',
        (2, 1): 'R',
        (2, 2): 'R',
        (2, 3): 'U',
    }
    values = first_visit_monte_carlo(grid, 100, policy)
    print('Values:')
    print_values(values, grid)
    print('Policy:')
    print_policy(policy, grid)

示例#2

显示文件

文件： td_zero.py 项目： Gistbatch/Reinforcement

def simple_example():
    grid = Gridworld.default_grid()
    print('Rewards:')
    print_values(grid.rewards, grid)
    policy = {
        (2, 0): 'U',
        (1, 0): 'U',
        (0, 0): 'R',
        (0, 1): 'R',
        (0, 2): 'R',
        (1, 2): 'R',
        (2, 1): 'R',
        (2, 2): 'R',
        (2, 3): 'U',
    }
    values = td_zero(grid, policy)
    print('Values:')
    print_values(values, grid)
    print('Policy:')
    print_policy(policy, grid)

示例#3

显示文件

def mc_prediction():
    grid = Gridworld.default_grid()
    print('Rewards:')
    print_values(grid.rewards, grid)
    policy = {
        (2, 0): 'U',
        (1, 0): 'U',
        (0, 0): 'R',
        (0, 1): 'R',
        (0, 2): 'R',
        (1, 2): 'U',
        (2, 1): 'L',
        (2, 2): 'U',
        (2, 3): 'L',
    }
    values, deltas = approx_monte_carlo(grid, policy)
    plt.plot(deltas)
    plt.show()
    print('Values:')
    print_values(values, grid)
    print('Policy:')
    print_policy(policy, grid)

示例#4

显示文件

文件： policy_iteration.py 项目： Gistbatch/Reinforcement

def simple_example():
    grid = Gridworld.default_grid()
    values_uniform = policy_evaluation(grid, 1)
    print('values for uniformly random actions:')
    print_values(values_uniform, grid)
    print('\n\n')

    fixed_policy = {
        (2, 0): 'U',
        (1, 0): 'U',
        (0, 0): 'R',
        (0, 1): 'R',
        (0, 2): 'R',
        (1, 2): 'R',
        (2, 1): 'R',
        (2, 2): 'R',
        (2, 3): 'U',
    }
    print_policy(fixed_policy, grid)
    fixed_values = policy_evaluation(grid, 0.9, fixed_policy)
    print('Values for fixed policy:')
    print_values(fixed_values, grid)