Python AlbertForTokenClassification.from_pretrainedの例

プログラミング言語: Python

名前空間/パッケージ名: transformers

メソッド/関数: from_pretrained

hotexamples.comのコード掲載数: 6

Python AlbertForTokenClassification.from_pretrained - 6件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのtransformers.AlbertForTokenClassification.from_pretrainedの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

from_pretrained(6)

AlbertForTokenClassification(4)

eval(3)

to(3)

load_state_dict(1)

コード例 #1

ファイルを表示

def launch(training_flag, test_flag):
    tokenizer = AlbertTokenizer.from_pretrained('albert-base-v2')
    if training_flag:
        model = AlbertForTokenClassification.from_pretrained(
            'albert-base-v2', num_labels=len(tags_vals))
        ## ---------12 . Optimizer -> weight regularization is  a solution to reduce the overfitting of a deep learning
        """ 
        Last keras optimization 2020 (rates from 0.01 seem to be best hyperparamater )for weight regularization for weights layers
            from keras.layers import LSTM
            from keras.regularizers import l2
        model.add(LSTM(32, kernel_regularizer=l2(0.01), recurrent_regularizer=l2(0.01), bias_regularizer=l2(0.01))) 
        Note :  BERT not include beta an gamma parametres for optimization
        """
        FULL_FINETUNING = True
        if FULL_FINETUNING:
            param_optimizer = list(model.named_parameters())
            no_decay = ['bias', 'gamma', 'beta']
            optimizer_grouped_parameters = [{
                'params': [
                    p for n, p in param_optimizer
                    if not any(nd in n for nd in no_decay)
                ],
                'weight_decay_rate':
                0.01
            }, {
                'params': [
                    p for n, p in param_optimizer
                    if any(nd in n for nd in no_decay)
                ],
                'weight_decay_rate':
                0.0
            }]
        else:
            param_optimizer = list(model.classifier.named_parameters())
            optimizer_grouped_parameters = [{
                "params": [p for n, p in param_optimizer]
            }]
        optimizer = Adam(optimizer_grouped_parameters, lr=args.lr)
        launch_training(training_path=args.training_data,
                        training_epochs=args.epochs,
                        valid_path=args.validate_data,
                        training_batch_size=1,
                        model=model,
                        model_path=model_path,
                        tokenizer=tokenizer,
                        optimizer=optimizer)
    if test_flag:
        if args.save:
            model_path = args.save + 'pytorch_model.bin'
            config = AlbertConfig.from_json_file(args.save + '/config.json')
            model = AlbertForTokenClassification.from_pretrained(args.save,
                                                                 config=config)
        else:
            model = AlbertForTokenClassification.from_pretrained(
                'albert-base-v2', num_labels=len(tags_vals))
        launch_test_directory(test_path=test_flag,
                              model=model,
                              tokenizer=tokenizer)

コード例 #2

ファイルを表示

ファイル: BERT_CRF.py プロジェクト: xhsun1997/iamQA

    def __init__(self,
                 config_name: str,
                 model_name: str = None,
                 num_tags: int = 2,
                 batch_first: bool = True) -> None:
        # 记录batch_first
        self.batch_first = batch_first

        # 模型的配置文件
        # if not os.path.exists(config_name):
        #     raise ValueError(
        #         "未找到模型配置文件 '{}'".format(config_name)
        #     )
        # else:
        self.config_name = config_name

        # 模型的预训练的参数文件，如果没有，就不加载
        # if model_name is not None:
        #     if not os.path.exists(model_name):
        #         raise ValueError(
        #             "未找到模型预训练参数文件 '{}'".format(model_name)
        #         )
        #     else:
        self.model_name = model_name
        # else:
        #     self.model_name = None

        if num_tags <= 0:
            raise ValueError(f'invalid number of tags: {num_tags}')

        super().__init__()
        # bert 的config文件
        self.bert_config = AutoConfig.from_pretrained(self.config_name)
        self.bert_config.num_labels = num_tags
        self.model_kwargs = {'config': self.bert_config}

        # 如果模型不存在
        if self.model_name is not None:
            self.bertModel = AlbertForTokenClassification.from_pretrained(
                self.model_name, **self.model_kwargs)
        else:
            self.bertModel = AlbertForTokenClassification(self.bert_config)

        # for name, param in list(self.bertModel.named_parameters())[:-4]:
        #     #     if name.startswith('bert'):
        #     param.requires_grad = False

        self.crf_model = CRF(num_tags=num_tags, batch_first=batch_first)

コード例 #3

ファイルを表示

    def __init__(self, config):
        self.tokenizer = BertTokenizer.from_pretrained(config.albert_path)
        self.model = AlbertForTokenClassification.from_pretrained(
            config.albert_path)

        tags = [
            'B_ns',
            'M_ns',
            'E_ns',
            'B_nr',
            'M_nr',
            'E_nr',
            'B_nt',
            'M_nt',
            'E_nt',
            'O',
        ]
        self.tag2id = {tag: idx for idx, tag in enumerate(tags)}
        self.id2tag = {idx: tag for idx, tag in enumerate(tags)}

コード例 #4

ファイルを表示

ファイル: albert_ner.py プロジェクト: caonlp/ner

train_data = TensorDataset(tr_inputs, tr_masks, tr_tags)
train_sampler = RandomSampler(train_data)
train_dataloader = DataLoader(train_data, sampler=train_sampler, batch_size=bs)

valid_data = TensorDataset(val_inputs, val_masks, val_tags)
valid_sampler = SequentialSampler(valid_data)
valid_dataloader = DataLoader(valid_data, sampler=valid_sampler, batch_size=bs)

test_data = TensorDataset(te_inputs, te_masks, te_tags)
test_sampler = SequentialSampler(test_data)
test_dataloader = DataLoader(test_data, sampler=test_sampler, batch_size=bs)

model = AlbertForTokenClassification.from_pretrained(
    "albert-base-v2",
    num_labels=len(tag2idx),
    output_attentions=False,
    output_hidden_states=False)
#model.resize_token_embeddings(len(tokenizer))
model.to(device)

FULL_FINETUNING = True
if FULL_FINETUNING:
    param_optimizer = list(model.named_parameters())
    no_decay = ['bias', 'gamma', 'beta']
    optimizer_grouped_parameters = [{
        'params':
        [p for n, p in param_optimizer if not any(nd in n for nd in no_decay)],
        'weight_decay_rate':
        0.01
    }, {

コード例 #5

ファイルを表示

ファイル: train_SI.py プロジェクト: valalithak/propaganda_detection

tokenizer = identification.tokenizer
TAGGING_SCHEME = identification.TAGGING_SCHEME
BATCH_SIZE = identification.BATCH_SIZE
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

train_dataloader, train_sentences, train_bert_examples = identification.get_data(
    articles, spans, train_indices)
eval_dataloader, eval_sentences, eval_bert_examples = identification.get_data(
    articles, spans, eval_indices)

num_labels = 2 + int(
    TAGGING_SCHEME == "BIO") + 2 * int(TAGGING_SCHEME == "BIOE")
if identification.LANGUAGE_MODEL == "Albert":
    from transformers import AlbertForTokenClassification
    model = AlbertForTokenClassification.from_pretrained('albert-base-v2',
                                                         num_labels=num_labels)
else:
    from transformers import BertForTokenClassification
    model = BertForTokenClassification.from_pretrained('bert-base-uncased',
                                                       num_labels=num_labels)

if torch.cuda.is_available():
    print('Using cuda')
    model.cuda()

if TAGGING_SCHEME == "BIOE":
    WEIGHTS = torch.tensor([1.0, 5.0, 10.0, 5.0])
    if torch.cuda.is_available():
        WEIGHTS = WEIGHTS.cuda()
else:
    WEIGHTS = torch.tensor([1.0, 100.0]).cuda()

コード例 #6

ファイルを表示

ファイル: kb_ner.py プロジェクト: oncores/KB-ALBERT-InfoFinder

def rcml_main(args):
    logger.info('KB-ALBERT 중요 정보 추출기 동작')

    if args.local_rank == -1 or args.no_cuda:
        device = torch.device("cuda" if torch.cuda.is_available()
                              and not args.no_cuda else "cpu")
        n_gpu = torch.cuda.device_count()
    else:
        torch.cuda.set_device(args.local_rank)
        device = torch.device("cuda", args.local_rank)
        n_gpu = 1
        # Initializes the distributed backend which will take care of sychronizing nodes/GPUs
        torch.distributed.init_process_group(backend='nccl')

    logger.info(
        "device: {} n_gpu: {}, distributed training: {}, 16-bits training: {}".
        format(device, n_gpu, bool(args.local_rank != -1), args.fp16))

    args.train_batch_size = args.train_batch_size // args.gradient_accumulation_steps

    random.seed(args.seed)
    np.random.seed(args.seed)
    torch.manual_seed(args.seed)
    torch.cuda.manual_seed(args.seed)

    if n_gpu > 0:
        torch.cuda.manual_seed_all(args.seed)
    if os.path.exists(args.output_dir) and os.listdir(
            args.output_dir) and args.do_train:
        raise ValueError(
            "Output directory ({}) already exists and is not empty.".format(
                args.output_dir))
    if not os.path.exists(args.output_dir):
        os.makedirs(args.output_dir)

    processor = NerProcessor()
    converter = convert_examples_to_features_ner

    label_list = processor.get_labels(args.data_dir)
    label_map = {i: label for i, label in enumerate(label_list)}
    num_labels = len(label_list)

    tokenizer = KbAlbertCharTokenizer.from_pretrained(args.bert_model_path)

    train_sen_examples = None
    eval_sen_examples = None
    test_sen_examples = None

    num_train_optimization_steps = None

    if args.do_train:
        train_sen_examples = processor.get_train_examples(args.data_dir)
        eval_sen_examples = processor.get_dev_examples(args.data_dir)

        train_sen_features = converter(train_sen_examples, label_list,
                                       args.max_seq_length, tokenizer)
        eval_sen_features = converter(eval_sen_examples, label_list,
                                      args.max_seq_length, tokenizer)

        num_train_optimization_steps = int(
            len(train_sen_examples) / args.train_batch_size /
            args.gradient_accumulation_steps) * args.num_train_epochs
        if args.local_rank != -1:
            num_train_optimization_steps = num_train_optimization_steps // torch.distributed.get_world_size(
            )

    if args.do_test:
        if args.do_prototype:
            test_sen_examples = processor.get_prototype_examples(args.data_dir)
        else:
            test_sen_examples = processor.get_test_examples(args.data_dir)
        test_sen_features = converter(test_sen_examples, label_list,
                                      args.max_seq_length, tokenizer)

    # Prepare model
    cache_dir = args.cache_dir if args.cache_dir else os.path.join(
        str(PYTORCH_PRETRAINED_BERT_CACHE), 'distributed_{}'.format(
            args.local_rank))
    config = AlbertConfig.from_pretrained(args.config_file_name,
                                          num_labels=num_labels,
                                          id2label=label_map)

    if args.do_train:
        model = AlbertForTokenClassification.from_pretrained(
            args.bert_model_path, config=config)

    elif args.do_test:
        model = torch.load(
            os.path.join(args.bert_model_path, args.bert_model_name))

    model.to(device)

    if args.local_rank != -1:
        try:
            from apex.parallel import DistributedDataParallel as DDP
        except ImportError:
            raise ImportError(
                "Please install apex from https://www.github.com/nvidia/apex to use distributed and fp16 training."
            )
        model = DDP(model)
    elif n_gpu > 1:
        model = torch.nn.DataParallel(model)

    # Prepare optimizer
    param_optimizer = list(model.named_parameters())
    no_decay = ['bias', 'LayerNorm.bias', 'LayerNorm.weight']
    optimizer_grouped_parameters = [{
        'params':
        [p for n, p in param_optimizer if not any(nd in n for nd in no_decay)],
        'weight_decay':
        0.01
    }, {
        'params':
        [p for n, p in param_optimizer if any(nd in n for nd in no_decay)],
        'weight_decay':
        0.0
    }]

    if args.do_train:
        optimizer = BertAdam(optimizer_grouped_parameters,
                             lr=args.learning_rate,
                             warmup=args.warmup_proportion,
                             t_total=num_train_optimization_steps)

    ##train_model
    global_step = 0
    if args.do_train:
        # model.unfreeze_bert_encoder()

        if len(train_sen_features) == 0:
            logger.info(
                "The number of train_features is zero. Please check the tokenization. "
            )
            sys.exit()

        logger.info("***** Running training *****")
        logger.info("  Num examples = %d", len(train_sen_examples))
        logger.info("  Batch size = %d", args.train_batch_size)
        logger.info("  Num steps = %d", num_train_optimization_steps)

        train_sen_input_ids = torch.tensor(
            [f.input_ids for f in train_sen_features], dtype=torch.long)
        train_sen_input_mask = torch.tensor(
            [f.input_mask for f in train_sen_features], dtype=torch.long)
        train_sen_segment_ids = torch.tensor(
            [f.segment_ids for f in train_sen_features], dtype=torch.long)
        train_sen_label_ids = torch.tensor(
            [f.label_id for f in train_sen_features], dtype=torch.long)

        eval_sen_input_ids = torch.tensor(
            [f.input_ids for f in eval_sen_features], dtype=torch.long)
        eval_sen_input_mask = torch.tensor(
            [f.input_mask for f in eval_sen_features], dtype=torch.long)
        eval_sen_segment_ids = torch.tensor(
            [f.segment_ids for f in eval_sen_features], dtype=torch.long)
        eval_sen_label_ids = torch.tensor(
            [f.label_id for f in eval_sen_features], dtype=torch.long)

        train_sen_data = TensorDataset(train_sen_input_ids,
                                       train_sen_input_mask,
                                       train_sen_segment_ids,
                                       train_sen_label_ids)
        eval_sen_data = TensorDataset(eval_sen_input_ids, eval_sen_input_mask,
                                      eval_sen_segment_ids, eval_sen_label_ids)

        train_sen_dataloader = DataLoader(
            train_sen_data,
            batch_size=args.train_batch_size,
            worker_init_fn=lambda _: np.random.seed())
        eval_sen_dataloader = DataLoader(eval_sen_data,
                                         batch_size=args.train_batch_size)

        train_loss_values, valid_loss_values = [], []
        train_acc, valid_acc = [], []
        train_f1, valid_f1 = [], []

        for epoch in trange(int(args.num_train_epochs), desc="Epoch"):
            model.train()
            total_loss = 0
            tr_predicted_labels, tr_target_labels = list(), list()

            for step, train_sen_batch in enumerate(
                    tqdm(train_sen_dataloader,
                         total=len(train_sen_dataloader),
                         desc="Iteration")):

                train_sen_batch = tuple(t.to(device) for t in train_sen_batch)
                sen_input_ids, sen_input_mask, sen_segment_ids, train_sen_label_ids = train_sen_batch

                output = model(input_ids=sen_input_ids,
                               attention_mask=sen_input_mask,
                               position_ids=None,
                               token_type_ids=sen_segment_ids,
                               labels=train_sen_label_ids)

                loss = output[0]
                loss.backward()

                total_loss += loss.item()

                logits = output[1].detach().cpu().numpy()
                label_ids = train_sen_label_ids.to('cpu').numpy()

                tr_predicted_labels.extend(
                    [list(p) for p in np.argmax(logits, axis=2)])
                tr_target_labels.extend(label_ids)

                if (step + 1) % args.gradient_accumulation_steps == 0:
                    if args.fp16:
                        # modify learning rate with special warm up BERT uses
                        # if args.fp16 is False, BertAdam is used that handles this automatically
                        lr_this_step = args.learning_rate * warmup_linear(
                            global_step / num_train_optimization_steps,
                            args.warmup_proportion)
                        for param_group in optimizer.param_groups:
                            param_group['lr'] = lr_this_step
                    optimizer.step()
                    optimizer.zero_grad()
                    global_step += 1

            tr_loss = total_loss / len(train_sen_dataloader)
            train_loss_values.append(tr_loss)

            tr_pred_tags = [
                label_list[p_i]
                for p, l in zip(tr_predicted_labels, tr_target_labels)
                for p_i, l_i in zip(p, l) if label_list[l_i] != "PAD"
            ]
            tr_target_tags = [
                label_list[l_i] for l in tr_target_labels for l_i in l
                if label_list[l_i] != "PAD"
            ]

            acc = accuracy_score(tr_pred_tags, tr_target_tags)
            f1 = f1_score(tr_pred_tags, tr_target_tags)
            train_acc.append(acc)
            train_f1.append(f1)

            logger.info('')
            logger.info(
                '################### epoch ################### : {}'.format(
                    epoch + 1))
            logger.info(
                '################### train loss ###################: {}'.
                format(tr_loss))
            logger.info(
                '################### train accuracy ###############: {}'.
                format(acc))
            logger.info(
                '################### train f1 score ###############: {}'.
                format(f1))

            eval_loss = 0
            ev_predicted_labels, ev_target_labels = list(), list()

            for eval_sen_batch in eval_sen_dataloader:
                eval_sen_batch = tuple(t.to(device) for t in eval_sen_batch)
                eval_sen_input_ids, eval_sen_input_mask, eval_sen_segment_ids, eval_label_ids = eval_sen_batch

                with torch.no_grad():
                    model.eval()
                    output = model(input_ids=eval_sen_input_ids,
                                   attention_mask=eval_sen_input_mask,
                                   position_ids=None,
                                   token_type_ids=eval_sen_segment_ids,
                                   labels=eval_label_ids)

                logits = output[1].detach().cpu().numpy()
                label_ids = eval_label_ids.to('cpu').numpy()

                eval_loss += output[0].mean().item()

                ev_predicted_labels.extend(
                    [list(p) for p in np.argmax(logits, axis=2)])
                ev_target_labels.extend(label_ids)

            ev_loss = eval_loss / len(eval_sen_dataloader)
            valid_loss_values.append(ev_loss)

            ev_pred_tags = [
                label_list[p_i]
                for p, l in zip(ev_predicted_labels, ev_target_labels)
                for p_i, l_i in zip(p, l) if label_list[l_i] != "PAD"
            ]
            ev_target_tags = [
                label_list[l_i] for l in ev_target_labels for l_i in l
                if label_list[l_i] != "PAD"
            ]

            acc = accuracy_score(ev_pred_tags, ev_target_tags)
            f1 = f1_score(ev_pred_tags, ev_target_tags)
            valid_acc.append(acc)
            valid_f1.append(f1)

            logger.info('')
            logger.info(
                '################### valid loss ###################: {}'.
                format(ev_loss))
            logger.info(
                '################### valid accuracy ###############: {}'.
                format(acc))
            logger.info(
                '################### valid f1 score ###############: {}'.
                format(f1))

            model_to_save = model.module if hasattr(model, 'module') else model
            if (epoch + 1) % 5 == 0:
                torch.save(model_to_save.state_dict(),
                           './model/eval_model/{}_epoch.bin'.format(epoch + 1))
                torch.save(model,
                           './model/eval_model/{}_epoch.pt'.format(epoch + 1))
        save_training_result = train_loss_values, train_acc, train_f1, valid_loss_values, valid_acc, valid_f1
        with open('./output_dir/training_history.pkl', 'wb') as f:
            pickle.dump(save_training_result, f)

    if args.do_test:
        # logger.info("***** Running prediction *****")
        # logger.info("  Num examples = %d", len(test_sen_examples))
        # logger.info("  Batch size = %d", args.eval_batch_size)

        test_sen_input_ids = torch.tensor(
            [f.input_ids for f in test_sen_features], dtype=torch.long)
        test_sen_input_mask = torch.tensor(
            [f.input_mask for f in test_sen_features], dtype=torch.long)
        test_sen_segment_ids = torch.tensor(
            [f.segment_ids for f in test_sen_features], dtype=torch.long)
        test_sen_label_ids = torch.tensor(
            [f.label_id for f in test_sen_features], dtype=torch.long)

        test_sen_data = TensorDataset(test_sen_input_ids, test_sen_input_mask,
                                      test_sen_segment_ids, test_sen_label_ids)

        # Run prediction for full data
        test_sen_dataloader = DataLoader(test_sen_data,
                                         batch_size=args.eval_batch_size)
        all_labels = None
        te_predicted_labels, te_target_labels = list(), list()

        for test_sen_batch in tqdm(test_sen_dataloader,
                                   total=len(test_sen_dataloader),
                                   desc='Prediction'):

            test_sen_batch = tuple(t.to(device) for t in test_sen_batch)
            test_sen_input_ids, test_sen_input_mask, test_sen_segment_ids, test_label_ids = test_sen_batch

            with torch.no_grad():
                model.eval()
                output = model(input_ids=test_sen_input_ids,
                               attention_mask=test_sen_input_mask,
                               position_ids=None,
                               token_type_ids=test_sen_segment_ids)

            logits = output[0].detach().cpu().numpy()
            label_ids = test_label_ids.to('cpu').numpy()

            te_predicted_labels.extend(
                [list(p) for p in np.argmax(logits, axis=2)])
            te_target_labels.extend(label_ids)

            te_pred_tags = [
                label_list[p_i]
                for p, l in zip(te_predicted_labels, te_target_labels)
                for p_i, l_i in zip(p, l) if label_list[l_i] != "PAD"
            ]
            te_target_tags = [
                label_list[l_i] for l in te_target_labels for l_i in l
                if label_list[l_i] != "PAD"
            ]

            if all_labels is None:
                all_labels = label_ids
            else:
                all_labels = np.concatenate((all_labels, label_ids), axis=0)

        acc = accuracy_score(te_pred_tags, te_target_tags)
        f1 = f1_score(te_pred_tags, te_target_tags)

        # logger.info('################### test accuracy ###############: {}'.format(acc))
        # logger.info('################### test f1 score ###############: {}'.format(f1))

        # tokenized_testcase = [[tokenizer.tokenize(str(j)) for j in input_example.text_a] for input_example in test_sen_examples]
        tokenized_testcase = [
            tokenizer.tokenize(str(i.text_a)) for i in test_sen_examples
        ]
        # input_data = [{'id': input_example.guid, 'text': input_example.text_a} for input_example in test_sen_examples]

        real_text = pd.DataFrame(tokenized_testcase)
        pred_text = pd.DataFrame(te_predicted_labels)

        pred_text.to_excel('./output_dir/output_ner_pred.xlsx')
        real_text.to_excel('./output_dir/output_ner_tokenized.xlsx')