Python DummyVecEnv.save_running_average 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: stable_baselines.common.vec_env

클래스/타입: DummyVecEnv

메소드/함수: save_running_average

hotexamples.com에서의 예제들: 3

Python DummyVecEnv.save_running_average - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 stable_baselines.common.vec_env.DummyVecEnv.save_running_average에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

DummyVecEnv(30)

step(30)

close(30)

render(30)

env_method(24)

reset(19)

get_attr(6)

training(4)

set_attr(4)

seed(4)

save(4)

load_running_average(3)

save_running_average(3)

norm_reward(3)

get_original_obs(2)

append(2)

keyboard_map(1)

get_episode_rewards(1)

action_space(1)

set_obs(1)

base_env(1)

exit(1)

get_episode_constraints(1)

reward_range(1)

model(1)

reset_monitor(1)

get_images(1)

observation_space(1)

normalize_reward(1)

normalize_obs(1)

_normalize_observation(1)

wait(1)

예제 #1

파일 보기

	val = model.env.env_method("_send_config")[0]
	names, values= val[0],val[1]
	for i in range(len(values)):
		sql = ''' INSERT INTO parameters(simu, type, step, value)
			VALUES(?,?,?,?) '''
		val = (model_name, names[i], 0, float(values[i]))
		cur.execute(sql,val)
		conn.commit()
	cur.close()
	conn.close()
	
	
	for i in range(args.total_steps//args.save_every):
		model.learn(total_timesteps=args.save_every, tb_log_name=model_name, reset_num_timesteps=False, callback=callback)
		if normalize:
			env.save_running_average(workDirectory+"/resultats/"+model_name+"/normalizeData")
		model.save(workDirectory+"/resultats/"+model_name+"/"+model_name)
		os.system("python3 makegif.py --algo "+args.algo+" --dir ./server/assets/"+model_name+"_"+str((i+1)*args.save_every)+"_steps.gif --name "+model_name)
		print("\n saved at "+str((i+1)*args.save_every))
	model.save(workDirectory+"/resultats/"+model_name+"/"+model_name)	
	if normalize:
		env.save_running_average(workDirectory+"/resultats/"+model_name+"/normalizeData")
	env = DummyVecEnv([lambda:  e.AidaBulletEnv(commands,
													  render  = False, 
													  on_rack = False,
													  default_reward     = args.default_reward,
													  height_weight      = args.height_weight,
													  orientation_weight = args.orientation_weight,
													  direction_weight   = args.direction_weight,

													  speed_weight       = args.speed_weight,

예제 #2

파일 보기

model.learn(n_timesteps, **kwargs)

if args.teleop:
    env.wait()
    env.exit()
    time.sleep(0.5)
else:
    # Close the connection properly
    env.reset()
    if isinstance(env, VecFrameStack):
        env = env.venv
    # HACK to bypass Monitor wrapper
    env.envs[0].env.exit_scene()

# Save trained model
model.save(os.path.join(save_path, ENV_ID), cloudpickle=True)
# Save hyperparams
with open(os.path.join(params_path, 'config.yml'), 'w') as f:
    yaml.dump(saved_hyperparams, f)

if args.save_vae and vae is not None:
    print("Saving VAE")
    vae.save(os.path.join(params_path, 'vae'))

if normalize:
    # Unwrap
    if isinstance(env, VecFrameStack):
        env = env.venv
    # Important: save the running average, for testing the agent we need that normalization
    env.save_running_average(params_path)

예제 #3

파일 보기

파일: train_yumi_her.py 프로젝트: hwaxxer/det2stoc

def callback(_locals, _globals):
    global n_steps

    n_steps += 1
    if n_steps % 50000 == 0 or n_steps == 10000:
        print('Saving: ', n_steps)
        save_path = 'checkpoints/yumi/her/her_{}_task_{}_{}.npy'.format(
            name, args.task, n_steps)
        os.makedirs(os.path.dirname(save_path), exist_ok=True)
        model.save(save_path)

    return True


model = HER('MlpPolicy',
            env,
            model_class=DDPG,
            verbose=1,
            tensorboard_log=log_dir,
            **dict(random_exploration=.2))
model.learn(total_timesteps=total_timesteps, callback=callback)
model.save("her-yumi-{}-final".format(n_steps))

env.save_running_average(log_dir)

obs = env.reset()
for i in range(100):
    action, _states = model.predict(obs)
    obs, rewards, dones, info = env.step(action)
    env.render()