Python GridWorld.actor_state_row Beispiele

Programmiersprache: Python

Namespace / Paketname: gridworld

Klasse / Typ: GridWorld

Methode / Funktion: actor_state_row

Beispiele auf hotexamples.com: 1

Python GridWorld.actor_state_row - 1 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die gridworld.GridWorld.actor_state_row, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

GridWorld(30)

gridsize(5)

set_ideal_grid(5)

height(4)

width(4)

load(3)

get_expert_action(3)

move(3)

perform_action(2)

get_state_data(2)

get_surroundings(2)

__init__(2)

get_cell(2)

draw(2)

end(2)

add_goal(2)

add_start(2)

process_events(2)

place_exit(1)

_fill_rect(1)

__move__(1)

grid_coordinates_to_indices(1)

act(1)

q_learning(1)

is_terminal(1)

play(1)

load_state_data(1)

loop(1)

min_remaining_moves(1)

get_starting_position(1)

plot_policy(1)

move_dir(1)

get_state(1)

action_space_sample(1)

get_s0(1)

draw_shape(1)

add_horizontal_wall(1)

add_trap(1)

add_vertical_wall(1)

available_actions(1)

create(1)

create_agents(1)

do_action(1)

draw_path(1)

evaluate(1)

get_reward(1)

generate(1)

generate_states(1)

getActions(1)

getStates(1)

Beispiel #1

Datei anzeigen

while settings.episodes > episode:
    # Prepare environment for playing
    env.reset()

    # Reset or increment values
    terminal = False
    episode += 1
    step = 0
    q_max_arr = []
    reward_arr = []
    epsilon_arr = []

    while not terminal and step < settings.train_step_limit:
        step += 1
        # Get the Q-values of the current state
        state_row = env.actor_state_row()
        q_values = q_table.get_state_q(state_row)
        # Save max(Q(s,a)) for stats
        q_max = np.max(q_values)

        # Anneal epsilon
        if epsilon > settings.final_epsilon:
            epsilon = settings.initial_epsilon - (2 * episode /
                                                  float(settings.episodes))
        else:
            # Final epsilon reached, stop annealing.
            epsilon = settings.final_epsilon

        # Select action
        if (np.random.random() < epsilon):
            # Choose random action