Python make_random_subset_buffers示例

编程语言: Python

命名空间/包名称: mbrl_utils

方法/功能: make_random_subset_buffers

hotexamples.com的示例: 2

Python make_random_subset_buffers - 已找到2个示例。这些是从开源项目中提取的最受好评的mbrl_utils.make_random_subset_buffers现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： train_atari_uvdeconv_tacn_midtwgradloss.py 项目： johannah/planning_on_models

def load_data_fn(info):
    # transform is dependent on loss type
    data_dict, data_paths = make_random_subset_buffers(
        dataset_path=info['base_datadir'],
        buffer_path=info['base_train_buffer_path'],
        train_max_examples=info['size_training_set'],
        kernel_size=info['frame_shrink_kernel_size'],
        trim_before=info['frame_shrink_trim_before'],
        trim_after=info['frame_shrink_trim_after'],
    )

    info['num_actions'] = data_dict['train'].num_actions()
    info['num_rewards'] = data_dict['train'].num_rewards()
    # assume actions/rewards are 0 indexed
    assert (min(data_dict['train'].rewards) == 0)
    assert (max(data_dict['train'].rewards) == info['num_rewards'] - 1)
    assert (min(data_dict['train'].actions) == 0)
    assert (max(data_dict['train'].actions) == info['num_actions'] - 1)
    return data_dict, info

示例#2

显示文件

文件： train_atari_uvdeconv_pcnns_tacn_diff.py 项目： johannah/planning_on_models

def create_models(info, model_loadpath='', dataset_name='FashionMNIST'):
    '''
    load details of previous model if applicable, otherwise create new models
    '''
    train_cnt = 0
    epoch_cnt = 0

    # use argparse device no matter what info dict is loaded
    preserve_args = ['device', 'batch_size', 'save_every_epochs',
                     'base_filepath', 'model_loadpath', 'perplexity',
                     'use_pred']
    largs = info['args']
    # load model if given a path
    if model_loadpath !='':
        _dict = torch.load(model_loadpath, map_location=lambda storage, loc:storage)
        dinfo = _dict['info']
        pkeys = info.keys()
        for key in dinfo.keys():
            if key not in preserve_args or key not in pkeys:
                info[key] = dinfo[key]
        train_cnt = info['train_cnts'][-1]
        epoch_cnt = info['epoch_cnt']
        info['args'].append(largs)

    # transform is dependent on loss type
    data_dict, data_paths = make_random_subset_buffers(dataset_path=info['base_datadir'],
                                           buffer_path=info['base_train_buffer_path'],
                                           train_max_examples=info['size_training_set'],
                                           kernel_size=info['frame_shrink_kernel_size'],
                                                       trim=info['frame_shrink_trim'])

    info['frame_height'] = data_dict['train'].frame_height
    info['frame_width'] = data_dict['train'].frame_width
    info['num_actions'] = data_dict['train'].num_actions()
    info['num_rewards'] = data_dict['train'].num_rewards()
    # assume actions/rewards are 0 indexed
    assert(min(data_dict['train'].rewards) == 0)
    assert(max(data_dict['train'].rewards) == info['num_rewards']-1)
    assert(min(data_dict['train'].actions) == 0)
    assert(max(data_dict['train'].actions) == info['num_actions']-1)

    # pixel cnn architecture is dependent on loss
    # for dml prediction, need to output mixture of size nmix
    info['nmix'] =  (2*info['nr_logistic_mix']+info['nr_logistic_mix'])*info['target_channels']
    info['output_dim']  = info['nmix']
    # last layer for pcnn - bias is 0 for dml
    info['last_layer_bias'] = 0.0

    # setup models
    # acn prior with vqvae embedding
    fwd_vq_acn_model = fwdACNVQVAEres(code_len=info['code_length'],
                               input_size=info['input_channels'],
                               output_size=info['output_dim'],
                               hidden_size=info['hidden_size'],
                               num_clusters=info['num_vqk'],
                               num_z=info['num_z'],
                               num_actions=info['num_actions'],
                               num_rewards=info['num_rewards'],
                               ).to(info['device'])

    prior_model = tPTPriorNetwork(size_training_set=info['size_training_set'],
                               code_length=info['code_length'], k=info['num_k']).to(info['device'])
    prior_model.codes = prior_model.codes.to(info['device'])

    pcnn_decoder = GatedPixelCNN(input_dim=info['target_channels'],
                                 output_dim=info['output_dim'],
                                 dim=info['pixel_cnn_dim'],
                                 n_layers=info['num_pcnn_layers'],
                                 # output dim is same as deconv output in this
                                 # case
                                 spatial_condition_size=info['output_dim'],
                                 last_layer_bias=info['last_layer_bias'],
                                 use_batch_norm=False,
                                 output_projection_size=info['output_projection_size']).to(info['device'])


    model_dict = {'fwd_vq_acn_model':fwd_vq_acn_model, 'prior_model':prior_model, 'pcnn_decoder_model':pcnn_decoder}
    parameters = []
    for name,model in model_dict.items():
        parameters+=list(model.parameters())
        print('created %s model with %s parameters' %(name,count_parameters(model)))

    model_dict['opt'] = optim.Adam(parameters, lr=info['learning_rate'])

    if args.model_loadpath !='':
       for name,model in model_dict.items():
            model_dict[name].load_state_dict(_dict[name+'_state_dict'])
    return model_dict, data_dict, info, train_cnt, epoch_cnt, rescale, rescale_inv