Python CMAESPolicy примеры использования

Язык программирования: Python

Пространство имен/Пакет: railrl.policies.cmaes_icm

Класс/Тип: CMAESPolicy

Примеров на hotexamples.com: 2

Python CMAESPolicy - 2 примера найдено. Это лучшие примеры Python кода для railrl.policies.cmaes_icm.CMAESPolicy, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

CMAESPolicy(2)

get_action(1)

Основные методы

CMAESPolicy (2)

get_action (1)

Пример #1

Показать файл

def test_icm_cmaes(encoder, inverse_model, forward_model, env, policy, sess):
	policy = CMAESPolicy(env.spec, encoder, inverse_model, forward_model, sess=sess)
	o = env.reset()
	while True:
		a, _ = policy.get_action([o], env=env)
		next_o, r, d, env_info = env.step(a)
		if d:
			o = env.reset()
		else:
			o = next_o
		env.render()
		time.sleep(0.05)

Пример #2

Показать файл

            pass

        # else:
        #     raise ValueError("Unsupported snapshot!")

        env = data['env']
        if args.test_state_hist:
            test_state_hist(env)
        elif args.get_max_reward:
            get_max_reward(env, policy, num_trajs=200)
        elif args.icm:
            if args.cmaes:
                from railrl.policies.cmaes_icm import CMAESPolicy
                policy = CMAESPolicy(env.spec,
                                     encoder,
                                     inverse_model,
                                     forward_model,
                                     sess=sess)
                test_icm_cmaes(encoder, inverse_model, forward_model, env,
                               policy, sess)
            elif args.test_inverse_loss:
                investigate_inverse_loss(encoder,
                                         inverse_model,
                                         forward_model,
                                         env,
                                         policy,
                                         sess,
                                         img_path=args.data_path,
                                         num_trajs=100,
                                         animate=args.render)
            elif args.test_forward_loss: