Python Policy.train_net Exemples

Langage de programmation: Python

Espace de nommage/Pack: Policy

Class/Type: Policy

Méthode/Fonction: train_net

Exemples au hotexamples.com: 1

Python Policy.train_net - 1 exemples trouvés. Ce sont les exemples réels les mieux notés de Policy.Policy.train_net extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Policy(30)

parameters(4)

load_state_dict(4)

eval(3)

__init__(2)

action(2)

to(2)

state_dict(2)

setHeight(1)

put_data(1)

resetValues(1)

sample(1)

sample_action(1)

setConfig(1)

IsValidStateAction(1)

setWidth(1)

set_parameters(1)

policyIteration(1)

toString(1)

train(1)

train_net(1)

update(1)

updateTargetNet(1)

sortedA(1)

load_reinforcement_model(1)

parse(1)

epsilonGreedy(1)

Policy_considerPolicy(1)

__str(1)

add_state(1)

buildGraph(1)

calcQ(1)

close_sess(1)

get_action_log_prob(1)

load_best_model(1)

get_state_action_probability(1)

get_state_probabilities(1)

import_all_data_and_train(1)

import_data_and_train(1)

improve_actor(1)

improve_critic(1)

insert_policy(1)

valueIteration(1)

Méthodes fréquemment utilisées

Policy (30)

parameters (4)

load_state_dict (4)

eval (3)

__init__ (2)

action (2)

to (2)

state_dict (2)

setHeight (1)

put_data (1)

Méthodes fréquemment utilisées

resetValues (1)

sample (1)

sample_action (1)

setConfig (1)

IsValidStateAction (1)

setWidth (1)

set_parameters (1)

policyIteration (1)

toString (1)

train (1)

train_net (1)

update (1)

updateTargetNet (1)

sortedA (1)

load_reinforcement_model (1)

parse (1)

epsilonGreedy (1)

Policy_considerPolicy (1)

__str (1)

add_state (1)

Méthodes fréquemment utilisées

train_net (1)

update (1)

updateTargetNet (1)

sortedA (1)

load_reinforcement_model (1)

parse (1)

epsilonGreedy (1)

Policy_considerPolicy (1)

__str (1)

add_state (1)

buildGraph (1)

calcQ (1)

close_sess (1)

get_action_log_prob (1)

load_best_model (1)

get_state_action_probability (1)

get_state_probabilities (1)

import_all_data_and_train (1)

import_data_and_train (1)

improve_actor (1)

improve_critic (1)

insert_policy (1)

valueIteration (1)

Méthodes fréquemment utilisées

buildGraph (1)

calcQ (1)

close_sess (1)

get_action_log_prob (1)

load_best_model (1)

get_state_action_probability (1)

get_state_probabilities (1)

import_all_data_and_train (1)

import_data_and_train (1)

improve_actor (1)

improve_critic (1)

insert_policy (1)

valueIteration (1)

Exemple #1

0

Afficher le fichier

Fichier : REINFORCE.py Projet : sumin123/RLstudy

def main(): env = gym.make('CartPole-v1') pi = Policy(LEARNING_RATE, GAMMA) score = 0.0 print_interval = 20 for n_epi in range(10000): s = env.reset() done = False while not done: prob = pi(torch.from_numpy(s).float()) m = Categorical(prob) a = m.sample() s_prime, r, done, info = env.step(a.item()) pi.put_data((r, prob[a])) s = s_prime score += r pi.train_net() if n_epi % print_interval == 0 and n_epi != 0: print("# of episode :{}, avg score: {}".format( n_epi, score / print_interval)) score = 0.0 env.close()