Python AsTypeの例

プログラミング言語: Python

名前空間/パッケージ名: rl_sandbox.transforms.general_transforms

メソッド/関数: AsType

hotexamples.comのコード掲載数: 3

Python AsType - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのrl_sandbox.transforms.general_transforms.AsTypeの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

device = torch.device("cuda:0")
# device = torch.device(c.CPU)

action_repeat = 1
num_frames = 1

aux_reward = MountainCarContinuousAuxiliaryReward()
num_tasks = 1 + aux_reward.num_auxiliary_rewards

experiment_setting = {
    # Auxiliary Tasks
    c.AUXILIARY_TASKS: {},

    # Buffer
    c.BUFFER_PREPROCESSING:
    gt.AsType(),
    c.BUFFER_SETTING: {
        c.KWARGS: {
            c.MEMORY_SIZE: 50000 // action_repeat,
            c.OBS_DIM: (obs_dim, ),
            c.H_STATE_DIM: (1, ),
            c.ACTION_DIM: (action_dim, ),
            c.REWARD_DIM: (num_tasks, ),
            c.INFOS: {
                c.MEAN: ((action_dim, ), np.float32),
                c.VARIANCE: ((action_dim, ), np.float32),
                c.ENTROPY: ((action_dim, ), np.float32),
                c.LOG_PROB: ((1, ), np.float32),
                c.VALUE: ((1, ), np.float32),
                c.DISCOUNTING: ((1, ), np.float32)
            },

コード例 #2

ファイルを表示

min_action = -np.ones(action_dim)
max_action = np.ones(action_dim)
# device = torch.device(c.CPU)
device = torch.device("cuda:0")

action_repeat = 1
num_frames = 1

memory_size = max_total_steps = 1000000 // action_repeat

experiment_setting = {
    # Auxiliary Tasks
    c.AUXILIARY_TASKS: {},

    # Buffer
    c.BUFFER_PREPROCESSING: gt.AsType(),
    c.BUFFER_SETTING: {
        c.KWARGS: {
            c.MEMORY_SIZE: memory_size,
            c.OBS_DIM: (obs_dim,),
            c.H_STATE_DIM: (1,),
            c.ACTION_DIM: (action_dim,),
            c.REWARD_DIM: (1,),
            c.INFOS: {c.MEAN: ((action_dim,), np.float32),
                      c.VARIANCE: ((action_dim,), np.float32),
                      c.ENTROPY: ((action_dim,), np.float32),
                      c.LOG_PROB: ((1,), np.float32),
                      c.VALUE: ((1,), np.float32),
                      c.DISCOUNTING: ((1,), np.float32)},
            c.CHECKPOINT_INTERVAL: 0,
            c.CHECKPOINT_PATH: None,

コード例 #3

ファイルを表示

ファイル: sac_lstm_experiment.py プロジェクト: chanb/rl_sandbox_public

# device = torch.device(c.CPU)

action_repeat = 1
num_frames = 1
hidden_state_dim = 128

memory_size = 1000000
max_total_steps = 1000000

experiment_setting = {
    # Auxiliary Tasks
    c.AUXILIARY_TASKS: {},

    # Buffer
    c.BUFFER_PREPROCESSING:
    gt.Compose([gt.AsType()]),
    c.BUFFER_SETTING: {
        c.KWARGS: {
            c.MEMORY_SIZE: memory_size,
            c.OBS_DIM: (obs_dim, ),
            c.H_STATE_DIM: (hidden_state_dim * 2, ),
            c.ACTION_DIM: (action_dim, ),
            c.REWARD_DIM: (1, ),
            c.INFOS: {
                c.MEAN: ((action_dim, ), np.float32),
                c.VARIANCE: ((action_dim, ), np.float32),
                c.ENTROPY: ((action_dim, ), np.float32),
                c.LOG_PROB: ((1, ), np.float32),
                c.VALUE: ((1, ), np.float32),
                c.DISCOUNTING: ((1, ), np.float32)
            },