Python JointBERT.parameters示例

编程语言: Python

命名空间/包名称: tatk.nlu.jointBERT.jointBERT

类/类型: JointBERT

方法/功能: parameters

hotexamples.com的示例: 2

Python JointBERT.parameters - 已找到2个示例。这些是从开源项目中提取的最受好评的tatk.nlu.jointBERT.jointBERT.JointBERT.parameters现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

JointBERT(4)

eval(3)

load_state_dict(3)

to(3)

named_parameters(2)

parameters(2)

forward(1)

parse(1)

save_pretrained(1)

state_dict(1)

train(1)

zero_grad(1)

示例#1

显示文件

文件： train.py 项目： zqwerty/tatk

        optimizer_grouped_parameters = [
            {'params': [p for n, p in model.named_parameters() if
                        not any(nd in n for nd in no_decay) and p.requires_grad],
             'weight_decay': config['model']['weight_decay']},
            {'params': [p for n, p in model.named_parameters() if any(nd in n for nd in no_decay) and p.requires_grad],
             'weight_decay': 0.0}
        ]
        optimizer = AdamW(optimizer_grouped_parameters, lr=config['model']['learning_rate'],
                          eps=config['model']['adam_epsilon'])
        scheduler = get_linear_schedule_with_warmup(optimizer, num_warmup_steps=config['model']['warmup_steps'],
                                                    num_training_steps=config['model']['max_step'])
    else:
        for n, p in model.named_parameters():
            if 'bert' in n:
                p.requires_grad = False
        optimizer = torch.optim.Adam(filter(lambda p: p.requires_grad, model.parameters()),
                                     lr=config['model']['learning_rate'])

    for name, param in model.named_parameters():
        print(name, param.shape, param.device, param.requires_grad)

    max_step = config['model']['max_step']
    check_step = config['model']['check_step']
    batch_size = config['model']['batch_size']
    model.zero_grad()
    train_slot_loss, train_intent_loss = 0, 0
    best_val_f1 = 0.

    writer.add_text('config', json.dumps(config))

    for step in range(1, max_step + 1):

示例#2

显示文件

文件： train.py 项目： Lireanstar/tatk

            'weight_decay':
            0.0
        }]
        optimizer = AdamW(optimizer_grouped_parameters,
                          lr=config['model']['learning_rate'],
                          eps=config['model']['adam_epsilon'])
        scheduler = WarmupLinearSchedule(
            optimizer,
            warmup_steps=config['model']['warmup_steps'],
            t_total=config['model']['max_step'])
    else:
        for n, p in model.named_parameters():
            if 'bert' in n:
                p.requires_grad = False
        optimizer = torch.optim.Adam(filter(lambda p: p.requires_grad,
                                            model.parameters()),
                                     lr=config['model']['learning_rate'])

    for name, param in model.named_parameters():
        print(name, param.shape, param.device, param.requires_grad)

    max_step = config['model']['max_step']
    check_step = config['model']['check_step']
    batch_size = config['model']['batch_size']
    model.zero_grad()
    set_seed(config['seed'])
    train_slot_loss, train_intent_loss = 0, 0
    best_val_f1 = 0.

    writer.add_text('config', json.dumps(config))