Python Actor.load_state_dict Exemples

Langage de programmation: Python

Espace de nommage/Pack: net

Class/Type: Actor

Méthode/Fonction: load_state_dict

Exemples au hotexamples.com: 3

Python Actor.load_state_dict - 3 exemples trouvés. Ce sont les exemples réels les mieux notés de net.Actor.load_state_dict extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Actor(15)

parameters(12)

load_state_dict(3)

eval(2)

modules(2)

state_dict(1)

to(1)

train(1)

zero_grad(1)

Méthodes fréquemment utilisées

Actor (15)

parameters (12)

load_state_dict (3)

eval (2)

modules (2)

state_dict (1)

to (1)

train (1)

zero_grad (1)

Exemple #1

0

Afficher le fichier

def load_model_ddpg(model_path, user_embeddings_path, item_embeddings_path, input_dim, action_dim, hidden_size, device): with open(user_embeddings_path, "rb") as f: user_embeddings = np.load(f) with open(item_embeddings_path, "rb") as f: item_embeddings = np.load(f) model = Actor(input_dim, action_dim, hidden_size, user_embeddings, item_embeddings) model.load_state_dict(torch.load(model_path, map_location=device)) model.eval() return model

Exemple #2

0

Afficher le fichier

def test(args=get_args()): env = QuadcopterEnv() model = Actor(None, env.observation_space.shape, env.action_space.shape, [-1, 1], args.device).to(args.device) args.model_path = os.path.join(args.logdir, 'lqr') model.load_state_dict( torch.load(os.path.join(args.model_path, 'policy.pth'), map_location=args.device)) for i in range(10): obs = env.reset() env.render() done = False while not done: act = model(obs.reshape((1, -1)))[0].detach().cpu().numpy()[0] obs, reward, done, info = env.step(act) env.render()

Exemple #3

0

Afficher le fichier

Fichier : dubin_lqr.py Projet : wangqiaoli/DynamicalRL

def test(args=get_args()): env = DubinEnv() # env.set_obs([]) model = Actor(None, env.observation_space['dynamics'].shape, env.action_space.shape, [-1, 1], args.device).to(args.device) args.model_path = os.path.join(args.logdir, 'lqr') model.load_state_dict( torch.load(os.path.join(args.model_path, 'policy.pth'), map_location=args.device)) for i in range(10): env.reset() # env.state[:2] -= env.goal[:2] # env.goal[:2] -= env.goal[:2] obs = env._obs() env.render() done = False while not done: normed_obs = obs['dynamics'].reshape((1, -1)) # /np.array([20,20,np.pi,1,np.pi]) act = model(normed_obs)[0].detach().cpu().numpy()[0] obs, reward, done, info = env.step(act) env.render()