Exemplos de Arena.battles em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: arena

Classe / Tipo: Arena

Método / Função: battles

Exemplos em hotexamples.com: 1

Arena.battles em Python - 1 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de arena.Arena.battles em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

Arena(30)

add_character(6)

fight(4)

arena_matrix(4)

add_player(2)

clear(2)

get_arena(2)

add_bandits(2)

corner_location(2)

add_players(2)

from_mdf_strings(1)

down_tiles_can_be_exploded(1)

draw(1)

draw_arena(1)

feed(1)

focus_on_next_ship(1)

AddGroups(1)

from_name(1)

getFitness(1)

getHeight(1)

get_destructible_walls(1)

get_non_destructible_walls(1)

handleNextMarbleMove(1)

left_tiles_can_be_exploded(1)

position_valid(1)

right_tiles_can_be_exploded(1)

up_tiles_can_be_exploded(1)

doMarbleMove(1)

compete(1)

delete_character(1)

_update_players_state(1)

Turn(1)

_can_place_bomb(1)

_set_dice(1)

_update_matrix_explosion_center(1)

_update_matrix_explosion_down(1)

_update_matrix_explosion_left(1)

_update_matrix_explosion_right(1)

_update_matrix_explosion_up(1)

add_obstacle(1)

copy(1)

agents(1)

aktualisiere(1)

animate_universe_history(1)

battles(1)

build_team_one(1)

build_team_two(1)

clearPoint(1)

coords_have_class(1)

update_explosion_in_matrix(1)

Métodos Frequentes

Arena (30)

add_character (6)

fight (4)

arena_matrix (4)

add_player (2)

clear (2)

get_arena (2)

add_bandits (2)

corner_location (2)

add_players (2)

Métodos Frequentes

from_mdf_strings (1)

down_tiles_can_be_exploded (1)

draw (1)

draw_arena (1)

feed (1)

focus_on_next_ship (1)

AddGroups (1)

from_name (1)

getFitness (1)

getHeight (1)

get_destructible_walls (1)

get_non_destructible_walls (1)

handleNextMarbleMove (1)

left_tiles_can_be_exploded (1)

position_valid (1)

right_tiles_can_be_exploded (1)

up_tiles_can_be_exploded (1)

doMarbleMove (1)

compete (1)

delete_character (1)

Métodos Frequentes

get_destructible_walls (1)

get_non_destructible_walls (1)

handleNextMarbleMove (1)

left_tiles_can_be_exploded (1)

position_valid (1)

right_tiles_can_be_exploded (1)

up_tiles_can_be_exploded (1)

doMarbleMove (1)

compete (1)

delete_character (1)

_update_players_state (1)

Turn (1)

_can_place_bomb (1)

_set_dice (1)

_update_matrix_explosion_center (1)

_update_matrix_explosion_down (1)

_update_matrix_explosion_left (1)

_update_matrix_explosion_right (1)

_update_matrix_explosion_up (1)

add_obstacle (1)

copy (1)

agents (1)

aktualisiere (1)

animate_universe_history (1)

battles (1)

build_team_one (1)

build_team_two (1)

clearPoint (1)

coords_have_class (1)

update_explosion_in_matrix (1)

Métodos Frequentes

_update_players_state (1)

Turn (1)

_can_place_bomb (1)

_set_dice (1)

_update_matrix_explosion_center (1)

_update_matrix_explosion_down (1)

_update_matrix_explosion_left (1)

_update_matrix_explosion_right (1)

_update_matrix_explosion_up (1)

add_obstacle (1)

copy (1)

agents (1)

aktualisiere (1)

animate_universe_history (1)

battles (1)

build_team_one (1)

build_team_two (1)

clearPoint (1)

coords_have_class (1)

update_explosion_in_matrix (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: train.py Projeto: reppy4620/TicTacToe

def train(n_epoch): env = Environment() arena = Arena() print('Making Models...') agents = [None, get_ddqn(env), get_ddqn(env)] agents[1].load('./models/agent1') # agents[1].replay_buffer.load('./models/replay1.npz') agents[2].load('./models/agent2') # agents[2].replay_buffer.load('./models/replay2.npz') for e in range(n_epoch): print('-' * 30) print(f'{e} Epoch Start...') print('-' * 30) for i in range(100): obs = env.reset(1) done = False rewards = [0] * 3 value = 0 last = None while not done: last = env.state action = agents[env.current_player].act_and_train( obs, rewards[env.current_player]) obs, r, done, value = env.step(action) rewards[env.current_player - 1] = r assert last is not None if value == 1: agents[1].stop_episode_and_train(env.state, 1, True) agents[-1].stop_episode_and_train(last, -1, True) elif value == -1: agents[-1].stop_episode_and_train(env.state, 1, True) agents[1].stop_episode_and_train(last, -1, True) elif value == 0: agents[1].stop_episode_and_train(env.state, 0, True) agents[-1].stop_episode_and_train(env.state, 0, True) elif value == 2: agents[1].stop_episode_and_train(env.state, -1, True) agents[-1].stop_episode() elif value == -2: agents[-1].stop_episode_and_train(env.state, -1, True) agents[1].stop_episode() # print(env.print_board()) # print('Result: ', value) print(f'{i} Episode Ended') res1, res2 = arena.battles(agents[1], agents[2]) if res1: dir_name = 'models/' + 'agent1' print('Saving model', dir_name) agents[1].save(dir_name) agents[1].replay_buffer.save('models/replay1.npz') if res2: dir_name = 'models/' + 'agent2' print('Saving model', dir_name) agents[2].save(dir_name) agents[2].replay_buffer.save('models/replay2.npz')