Python Policy.load_best_model Exemples

Langage de programmation: Python

Espace de nommage/Pack: Policy

Class/Type: Policy

Méthode/Fonction: load_best_model

Exemples au hotexamples.com: 1

Python Policy.load_best_model - 1 exemples trouvés. Ce sont les exemples réels les mieux notés de Policy.Policy.load_best_model extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Policy(30)

parameters(4)

load_state_dict(4)

eval(3)

__init__(2)

action(2)

to(2)

state_dict(2)

setHeight(1)

put_data(1)

resetValues(1)

sample(1)

sample_action(1)

setConfig(1)

IsValidStateAction(1)

setWidth(1)

set_parameters(1)

policyIteration(1)

toString(1)

train(1)

train_net(1)

update(1)

updateTargetNet(1)

sortedA(1)

load_reinforcement_model(1)

parse(1)

epsilonGreedy(1)

Policy_considerPolicy(1)

__str(1)

add_state(1)

buildGraph(1)

calcQ(1)

close_sess(1)

get_action_log_prob(1)

load_best_model(1)

get_state_action_probability(1)

get_state_probabilities(1)

import_all_data_and_train(1)

import_data_and_train(1)

improve_actor(1)

improve_critic(1)

insert_policy(1)

valueIteration(1)

Méthodes fréquemment utilisées

Policy (30)

parameters (4)

load_state_dict (4)

eval (3)

__init__ (2)

action (2)

to (2)

state_dict (2)

setHeight (1)

put_data (1)

Méthodes fréquemment utilisées

resetValues (1)

sample (1)

sample_action (1)

setConfig (1)

IsValidStateAction (1)

setWidth (1)

set_parameters (1)

policyIteration (1)

toString (1)

train (1)

train_net (1)

update (1)

updateTargetNet (1)

sortedA (1)

load_reinforcement_model (1)

parse (1)

epsilonGreedy (1)

Policy_considerPolicy (1)

__str (1)

add_state (1)

Méthodes fréquemment utilisées

train_net (1)

update (1)

updateTargetNet (1)

sortedA (1)

load_reinforcement_model (1)

parse (1)

epsilonGreedy (1)

Policy_considerPolicy (1)

__str (1)

add_state (1)

buildGraph (1)

calcQ (1)

close_sess (1)

get_action_log_prob (1)

load_best_model (1)

get_state_action_probability (1)

get_state_probabilities (1)

import_all_data_and_train (1)

import_data_and_train (1)

improve_actor (1)

improve_critic (1)

insert_policy (1)

valueIteration (1)

Méthodes fréquemment utilisées

buildGraph (1)

calcQ (1)

close_sess (1)

get_action_log_prob (1)

load_best_model (1)

get_state_action_probability (1)

get_state_probabilities (1)

import_all_data_and_train (1)

import_data_and_train (1)

improve_actor (1)

improve_critic (1)

insert_policy (1)

valueIteration (1)

Exemple #1

0

Afficher le fichier

def train_policies(self, load_best_policy=False, load_reinforcement=False): if load_reinforcement: for i in range(0, game_setting.K): policy = Policy(self.game_setting) file_name = policy.load_reinforcement_model(i) self.policies.append([policy, file_name, 0, 0]) return if load_best_policy: start = 1 policy = Policy(self.game_setting) nr_of_training_cases = policy.load_best_model() self.policies.append([policy, nr_of_training_cases, 0, 0]) else: start = 0 policy = Policy(self.game_setting) max_cases = min( policy.import_data_and_train(max_cases=self.max_cases, test_nr_of_cases=True), self.max_cases) if self.negative_training_power > 0: for i in range(start, self.K): nr_of_cases = max( 0, max_cases // ((i + 1)**self.negative_training_power)) if nr_of_cases > 0: policy = Policy(self.game_setting) actual_nr_of_cases = policy.import_data_and_train( max_cases=nr_of_cases) else: policy = Policy(self.game_setting, no_model=True) actual_nr_of_cases = 0 self.policies.append([policy, actual_nr_of_cases, 0, 0]) else: for i in range(start, self.K): policy = Policy(self.game_setting) nr_of_cases = max( int(max_cases * (self.K - i - 1) / (self.K - 1)), 0) if nr_of_cases > 0: actual_nr_of_cases = policy.import_data_and_train( max_cases=nr_of_cases) self.policies.append([policy, actual_nr_of_cases, 0, 0]) else: self.policies.append([policy, 0, 0, 0])