Exemplos de Agent.learn em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: network

Classe / Tipo: Agent

Método / Função: learn

Exemplos em hotexamples.com: 2

Agent.learn em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de network.Agent.learn em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

Agent(13)

choose_action(3)

learn(2)

action(1)

actor(1)

load(1)

log_probs(1)

remember(1)

save_models(1)

store_data(1)

update(1)

Métodos Frequentes

Agent (13)

choose_action (3)

learn (2)

action (1)

actor (1)

load (1)

log_probs (1)

remember (1)

save_models (1)

store_data (1)

Métodos Frequentes

update (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: main.py Projeto: Ahmetf1/Machine-Learning

game = GAME() game.set_timer(100) network = Network(n_output, lr_rate) agent = Agent(network, gamma, batch_size, n_action, input_dims, mem_size) scores = [] avg_rewards = [] score_max = 0 n_total = 0 for n in range(n_games): if not n == 0: scores.append(score) avg_rewards.append(total_reward / n_moves) agent.learn(n_total, n_total + n_moves) score = 0 game.score = 0 total_reward = 0 n_moves = 0 n_total = n_moves+n_total done = False observation = game.get_states() while not done: action = agent.choose_action(observation) if n < -1: game.draw() action = int(msvcrt.getch().decode("utf-8")) observation_, reward, done, score = game.spin_once(action, n_moves) agent.store_data(observation, action, reward, observation_, done)

Exemplo n.º 2

0

Exibir arquivo

score_record = [] score_record_step = [] count_record = [] count_record_step = [] time_record = [] time_record_step = [] for i in range(800): done = False score = 0 obs = env.get_init_state() # 没分配完 while not done: act = MECSnet.choose_action(obs) new_state, reward, done = env.step(act) MECSnet.remember(obs, act, reward, new_state, int(done)) MECSnet.learn() score += reward obs = new_state # print('reward is： {}'.format(reward)) # 本轮的reward追加到list中 score_record.append(score) # print('episode ', i, 'score %.2f' % score, '100 game average %.2f' % np.mean(score[-100:])) print('episode ', i, 'score %.2f' % score, " wrong: ", env.count_wrong) count_record.append(1 - env.count_wrong / num_task) time_record.append(env.time) if i % 25 == 0: # UEnet.save_models() MECSnet.save_models() score_record_step.append(np.mean(score_record)) count_record_step.append(np.mean(count_record))