Python Policy.share_memory Exemples

Langage de programmation: Python

Espace de nommage/Pack: models

Class/Type: Policy

Méthode/Fonction: share_memory

Exemples au hotexamples.com: 2

Python Policy.share_memory - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de models.Policy.share_memory extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Policy(30)

billing_schedule(8)

agent(8)

parameters(6)

load_state_dict(5)

named_insured(4)

set_state_stat(2)

share_memory(2)

find_by(2)

forward(2)

get(2)

save(1)

name_insured(1)

state_dict(1)

noresult(1)

new(1)

reset_rnn(1)

get_params(1)

name(1)

insert(1)

act(1)

file(1)

fail(1)

dir(1)

contenttype(1)

bill_schedule(1)

as_dict(1)

argument(1)

type(1)

Méthodes fréquemment utilisées

Policy (30)

billing_schedule (8)

agent (8)

parameters (6)

load_state_dict (5)

named_insured (4)

set_state_stat (2)

share_memory (2)

find_by (2)

forward (2)

Méthodes fréquemment utilisées

get (2)

save (1)

name_insured (1)

state_dict (1)

noresult (1)

new (1)

reset_rnn (1)

get_params (1)

name (1)

insert (1)

act (1)

file (1)

fail (1)

dir (1)

contenttype (1)

bill_schedule (1)

as_dict (1)

argument (1)

type (1)

Méthodes fréquemment utilisées

act (1)

file (1)

fail (1)

dir (1)

contenttype (1)

bill_schedule (1)

as_dict (1)

argument (1)

type (1)

Exemple #1

0

Afficher le fichier

Fichier : main.py Projet : valthom/Pytorch-DPPO

self.max_episode_length = 10000 self.seed = 1 self.env_name = 'Pendulum-v0' if __name__ == '__main__': os.environ['OMP_NUM_THREADS'] = '1' params = Params() torch.manual_seed(params.seed) env = gym.make(params.env_name) num_inputs = env.observation_space.shape[0] num_outputs = env.action_space.shape[0] shared_p = Policy(num_inputs, num_outputs) shared_v = Value(num_inputs) shared_p.share_memory() shared_v.share_memory() optimizer_p = my_optim.SharedAdam(shared_p.parameters(), lr=params.lr) optimizer_v = my_optim.SharedAdam(shared_v.parameters(), lr=params.lr) processes = [] p = mp.Process(target=test, args=(params.num_processes, params, shared_p)) p.start() processes.append(p) for rank in range(0, params.num_processes): p = mp.Process(target=train, args=(rank, params, shared_p, shared_v, optimizer_p, optimizer_v)) p.start() processes.append(p) for p in processes:

Exemple #2

0

Afficher le fichier

Fichier : train.py Projet : vinceau/LearnToSmash

# Getting action dim and observation dim from Env env = Env(args, device='cpu', options=options, dummy=True) observation_dim = env.observation_dim args.action_dim = env.action_dim env.close() print('Observation Space: {} / Action Dim: {}'.format( observation_dim, args.action_dim)) # Initializing shared memory used between workers and learner that contains the actor parameters shared_state_dict = Policy(args.action_dim) if args.load_model is not None: partial_load(shared_state_dict, args.load_model) if args.reset_policy: shared_state_dict.policy.weight.data.zero_() shared_state_dict.policy.bias.data.zero_() shared_state_dict = shared_state_dict.share_memory() # Creating learner learner = Learner(args, experience_buffer.queue_batch, shared_state_dict) # Creating actors actors = [] for i in range(args.n_workers): actor_name = 'actor_' + str(i) actor = Actor(args, experience_buffer.queue_trace, shared_state_dict, actor_name, rank=i) actors.append(actor)