Python Policy.action Exemples

Langage de programmation: Python

Espace de nommage/Pack: Policy

Class/Type: Policy

Méthode/Fonction: action

Exemples au hotexamples.com: 2

Python Policy.action - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de Policy.Policy.action extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Policy(30)

parameters(4)

load_state_dict(4)

eval(3)

__init__(2)

action(2)

to(2)

state_dict(2)

setHeight(1)

put_data(1)

resetValues(1)

sample(1)

sample_action(1)

setConfig(1)

IsValidStateAction(1)

setWidth(1)

set_parameters(1)

policyIteration(1)

toString(1)

train(1)

train_net(1)

update(1)

updateTargetNet(1)

sortedA(1)

load_reinforcement_model(1)

parse(1)

epsilonGreedy(1)

Policy_considerPolicy(1)

__str(1)

add_state(1)

buildGraph(1)

calcQ(1)

close_sess(1)

get_action_log_prob(1)

load_best_model(1)

get_state_action_probability(1)

get_state_probabilities(1)

import_all_data_and_train(1)

import_data_and_train(1)

improve_actor(1)

improve_critic(1)

insert_policy(1)

valueIteration(1)

Méthodes fréquemment utilisées

Policy (30)

parameters (4)

load_state_dict (4)

eval (3)

__init__ (2)

action (2)

to (2)

state_dict (2)

setHeight (1)

put_data (1)

Méthodes fréquemment utilisées

resetValues (1)

sample (1)

sample_action (1)

setConfig (1)

IsValidStateAction (1)

setWidth (1)

set_parameters (1)

policyIteration (1)

toString (1)

train (1)

train_net (1)

update (1)

updateTargetNet (1)

sortedA (1)

load_reinforcement_model (1)

parse (1)

epsilonGreedy (1)

Policy_considerPolicy (1)

__str (1)

add_state (1)

Méthodes fréquemment utilisées

train_net (1)

update (1)

updateTargetNet (1)

sortedA (1)

load_reinforcement_model (1)

parse (1)

epsilonGreedy (1)

Policy_considerPolicy (1)

__str (1)

add_state (1)

buildGraph (1)

calcQ (1)

close_sess (1)

get_action_log_prob (1)

load_best_model (1)

get_state_action_probability (1)

get_state_probabilities (1)

import_all_data_and_train (1)

import_data_and_train (1)

improve_actor (1)

improve_critic (1)

insert_policy (1)

valueIteration (1)

Méthodes fréquemment utilisées

buildGraph (1)

calcQ (1)

close_sess (1)

get_action_log_prob (1)

load_best_model (1)

get_state_action_probability (1)

get_state_probabilities (1)

import_all_data_and_train (1)

import_data_and_train (1)

improve_actor (1)

improve_critic (1)

insert_policy (1)

valueIteration (1)

Exemple #1

0

Afficher le fichier

def JN(domain: Domain, policy: Policy.Policy, N): # method to return the Expected value after N turn with a policy in a domain if N == 0: return 0 else: R = domain.reward(domain.state, policy.action(domain.state)) domain.moves(policy.action(domain.state)) return R + domain.gamma * JN(domain, policy, N-1)

Exemple #2

0

Afficher le fichier

def MatrixJN(domain: Domain, policy: Policy.Policy, N): # method to return the list of Matrix of Expected value after N turn with a policy in a domain L = [np.array([[0. for k in range(domain.n)] for l in range(domain.m)])] for h in range(1, N): L.append(np.array([[0. for k in range(domain.n)] for l in range(domain.m)])) for i in range(domain.n): for j in range(domain.m): L[-1][j][i] = domain.reward([i, j], policy.action([i, j])) L[-1][j][i] += domain.gamma * (1 - domain.beta) * L[-2][min(max(j + policy.action([i, j])[1], 0), domain.m - 1)][min(max(i + policy.action([i, j])[0], 0), domain.n - 1)] L[-1][j][i] += domain.gamma * domain.beta * L[-2][0][0] return L