Esempi in Python per ValueIteration.value_iteration

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: ValueIteration

Classe/tipologia: ValueIteration

Metodo/funzione: value_iteration

Esempi su hotexamples.com: 1

ValueIteration.value_iteration in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per ValueIteration.ValueIteration.value_iteration, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

ValueIteration(9)

valueIteration(4)

getQValues(2)

trial_run(2)

execute_policy(1)

getPolicy(1)

get_val(1)

iterate(1)

run(1)

runValueIteration(1)

set_utils(1)

solve(1)

trace_path(1)

value_iteration(1)

Esempio n. 1

Mostra file

File: Experiments_ValueIteration.py Progetto: shaoguangji/CS449

def experiment(test_game, num_experiments):
    """
    Main experiment method that runs the Value Iteration experiments and prints results
    works by learning a model x number of times.

    the average number of moves per policy is then created and averaged per experiment

    prints and returns the average number of episodes to reach the goal along with the learned policy.
    """

    average_number_of_moves_with_policy = []
    for x in range(num_experiments):
        # Learn Policy
        vi = ValueIteration(test_game)
        policy_and_num_iterations = vi.value_iteration()
        policy = policy_and_num_iterations[0]
        print(policy)

        avg_num_steps = 0
        for itter in range(100):
            num_steps = vi.execute_policy(policy)
            avg_num_steps += num_steps

        avg_num_steps /= 100.0

        average_number_of_moves_with_policy.append(avg_num_steps)

    total_average_num_steps = sum(average_number_of_moves_with_policy) / num_experiments
    print("Total Average Number of Steps: {}".format(total_average_num_steps))

    return total_average_num_steps