Esempi in Python per Actor.update_actor_target

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: Actor

Classe/tipologia: Actor

Metodo/funzione: update_actor_target

Esempi su hotexamples.com: 1

Actor.update_actor_target in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per Actor.Actor.update_actor_target, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Actor(30)

__init__(15)

train(15)

parameters(14)

choose_action(8)

learn(8)

predict(7)

train_fn(6)

eval(6)

state_dict(5)

load_state_dict(4)

load(4)

_loss_(3)

update(3)

setPos(2)

ChooseActionByPolicy(2)

save(2)

setcollaabb(2)

sethitaabb(2)

get_shortest_actor(2)

model(2)

build_net(2)

doAttack(1)

target_predict(1)

save_cache(1)

setLocation(1)

addtriumphs(1)

setUnqTags(1)

set_brain(1)

set_goal(1)

setaabb(1)

addedToWorld(1)

add_grad_to_graph(1)

addMovie(1)

stop(1)

take_damage_shortest_point(1)

target_actions(1)

target_predict_method(1)

run(1)

transfer_to_actor_model(1)

update_target(1)

update_actor_target(1)

updatePolicy(1)

act(1)

unpickleActors(1)

triumph(1)

train_p(1)

target_update_method(1)

action(1)

train_2(1)

Esempio n. 1

Mostra file

File: DDPG.py Progetto: lucashu1/wildlifeRL

    y_t = rewards_vector + GAMMA * target_q_values
    loss = critic.model.train_on_batch([states, actions], y_t)
    losses.append(loss)
    loss_writer.writerow({
        'episode': episode,
        'avg_reward': r_t,
        'critic_loss': loss
    })  # record losses

    # Update actor
    a_for_grad = actor.model.predict(states)
    grads = critic.gradients(states, a_for_grad)
    actor.train(states, grads)

    # Update target networks
    actor.update_actor_target()
    critic.update_critic_target()

    # Gradually decrease exploration
    epsilon *= EPSILON_DECAY

    # Print to terminal
    print("Episode: ", episode)
    print("Epsilon: ", epsilon)
    # print("S_t", s_t)
    print("Defender mu_sigma (a_t): ", a_t)
    # print("Defender locations list: ", def_coords_list)
    print("Defender average coords (row, col): ", def_avg_coords)
    print("Average reward (r_t): ", r_t)
    print("Critic Loss: ", loss)
    print()