Python ModelUtils.ActionFlattener示例

编程语言: Python

命名空间/包名称: mlagents.trainers.torch.utils

类/类型: ModelUtils

方法/功能: ActionFlattener

hotexamples.com的示例: 2

Python ModelUtils.ActionFlattener - 已找到2个示例。这些是从开源项目中提取的最受好评的mlagents.trainers.torch.utils.ModelUtils.ActionFlattener现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

list_to_tensor(30)

to_numpy(16)

masked_mean(13)

break_into_branches(12)

actions_to_onehot(9)

create_input_processors(8)

update_learning_rate(6)

DecayedValue(5)

soft_update(5)

get_probs_and_entropy(4)

get_encoder_for_type(4)

dynamic_partition(3)

create_residual_self_attention(2)

create_encoders(2)

ActionFlattener(2)

list_to_tensor_list(1)

polynomial_decay(1)

_check_resolution_for_encoder(1)

trust_region_policy_loss(1)

trust_region_value_loss(1)

示例#1

显示文件

文件： curiosity_reward_provider.py 项目： zt1217396582/ml-agents

    def __init__(self, specs: BehaviorSpec,
                 settings: CuriositySettings) -> None:
        super().__init__()
        self._policy_specs = specs
        state_encoder_settings = NetworkSettings(
            normalize=False,
            hidden_units=settings.encoding_size,
            num_layers=2,
            vis_encode_type=EncoderType.SIMPLE,
            memory=None,
        )
        self._state_encoder = NetworkBody(specs.observation_shapes,
                                          state_encoder_settings)

        self._action_flattener = ModelUtils.ActionFlattener(specs)

        self.inverse_model_action_prediction = torch.nn.Sequential(
            LinearEncoder(2 * settings.encoding_size, 1, 256),
            linear_layer(256, self._action_flattener.flattened_size),
        )

        self.forward_model_next_state_prediction = torch.nn.Sequential(
            LinearEncoder(
                settings.encoding_size + self._action_flattener.flattened_size,
                1, 256),
            linear_layer(256, settings.encoding_size),
        )

示例#2

显示文件

文件： gail_reward_provider.py 项目： tyohanan/ml-agents

    def __init__(self, specs: BehaviorSpec, settings: GAILSettings) -> None:
        super().__init__()
        self._policy_specs = specs
        self._use_vail = settings.use_vail
        self._settings = settings

        state_encoder_settings = NetworkSettings(
            normalize=False,
            hidden_units=settings.encoding_size,
            num_layers=2,
            vis_encode_type=EncoderType.SIMPLE,
            memory=None,
        )
        self._state_encoder = NetworkBody(specs.observation_shapes,
                                          state_encoder_settings)

        self._action_flattener = ModelUtils.ActionFlattener(specs)

        encoder_input_size = settings.encoding_size
        if settings.use_actions:
            encoder_input_size += (self._action_flattener.flattened_size + 1
                                   )  # + 1 is for done

        self.encoder = torch.nn.Sequential(
            linear_layer(encoder_input_size, settings.encoding_size),
            Swish(),
            linear_layer(settings.encoding_size, settings.encoding_size),
            Swish(),
        )

        estimator_input_size = settings.encoding_size
        if settings.use_vail:
            estimator_input_size = self.z_size
            self._z_sigma = torch.nn.Parameter(torch.ones((self.z_size),
                                                          dtype=torch.float),
                                               requires_grad=True)
            self._z_mu_layer = linear_layer(
                settings.encoding_size,
                self.z_size,
                kernel_init=Initialization.KaimingHeNormal,
                kernel_gain=0.1,
            )
            self._beta = torch.nn.Parameter(torch.tensor(self.initial_beta,
                                                         dtype=torch.float),
                                            requires_grad=False)

        self._estimator = torch.nn.Sequential(
            linear_layer(estimator_input_size, 1), torch.nn.Sigmoid())