Exemplos de run_for_n_games_and_print_stats em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: runners

Método / Função: run_for_n_games_and_print_stats

Exemplos em hotexamples.com: 3

run_for_n_games_and_print_stats em Python - 3 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de runners.run_for_n_games_and_print_stats em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Exemplo n.º 1

0

Exibir arquivo

Arquivo: experiment_tictactoe_with_PPO_agent_training_and_command_line_play.py Projeto: LorgneSchilooch/5IABD-ML

from agents import CommandLineAgent, DeepQLearningAgent, PPOAgent, RandomAgent from environments.tictactoe import TicTacToeGameState from runners import run_for_n_games_and_print_stats, run_step if __name__ == "__main__": gs = TicTacToeGameState() agent0 = PPOAgent(state_space_size=gs.get_vectorized_state().shape[0], action_space_size=gs.get_action_space_size()) agent1 = RandomAgent() for i in range(100): run_for_n_games_and_print_stats([agent0, agent1], gs, 5000) run_for_n_games_and_print_stats([agent0, agent1], gs, 100) gs_clone = gs.clone() while not gs_clone.is_game_over(): run_step([agent0, CommandLineAgent()], gs_clone) print(gs_clone) gs_clone = gs.clone() while not gs_clone.is_game_over(): run_step([CommandLineAgent(), agent1], gs_clone) print(gs_clone)

Exemplo n.º 2

0

Exibir arquivo

Arquivo: experiment_gridworld_with_tabular_like_deep_Q_learning_agent.py Projeto: LorgneSchilooch/5IABD-ML

from agents import TabularLikeDeepQLearningAgent from environments import GridWorldGameState from runners import run_for_n_games_and_print_stats, run_step if __name__ == "__main__": gs = GridWorldGameState() agent = TabularLikeDeepQLearningAgent(action_space_size=4) for i in range(500): run_for_n_games_and_print_stats([agent], gs, 100) agent.epsilon = -1.0 run_for_n_games_and_print_stats([agent], gs, 100) gs = gs.clone() while not gs.is_game_over(): run_step([agent], gs) print(gs)

Exemplo n.º 3

0

Exibir arquivo

Arquivo: experiment_tictactoe_with_half_alphazero_agent_versus_random_agent.py Projeto: Citaman/2020_5A_IABD_DRL_Gym

from agents import RandomRolloutAgent, MOMCTSAgent, RandomAgent, HalfAlphaZeroAgent from environments.tictactoe import TicTacToeGameState from runners import run_to_the_end, run_for_n_games_and_print_stats if __name__ == "__main__": import tensorflow as tf tf.compat.v1.disable_eager_execution() gs = TicTacToeGameState() agent0 = HalfAlphaZeroAgent(10, gs.get_action_space_size(), keep_memory=True) agent1 = RandomAgent() for _ in range(1000): run_for_n_games_and_print_stats([agent0, agent1], gs, 100, shuffle_players=True)