Python LoadMsraDataV2.LoadMsraDataV2の例

プログラミング言語: Python

名前空間/パッケージ名: nlp_applications.data_loader

クラス/型: LoadMsraDataV2

メソッド/関数: LoadMsraDataV2

hotexamples.comのコード掲載数: 2

Python LoadMsraDataV2.LoadMsraDataV2 - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのnlp_applications.data_loader.LoadMsraDataV2.LoadMsraDataV2の実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

LoadMsraDataV2(2)

よく使われるメソッド

LoadMsraDataV2 (2)

コード例 #1

ファイルを表示

ファイル: crf_model.py プロジェクト: ienoob/neo_nlp_project

            else:
                xindex, xlabel = x.split("-")
                if xindex == "B":
                    if start is not None:
                        extract_ner.append((start, i, label, input_x[start:i]))
                    start = i
                    label = xlabel
                else:
                    if label != xlabel:
                        start = None
                        label = None
        return extract_ner


if __name__ == "__main__":
    msra_data = LoadMsraDataV2("D:\data\\nlp\\命名实体识别\\msra_ner_token_level\\")

    print(msra_data.train_tag_list[0])

    X_train = [sent2features(s) for s in msra_data.train_sentence_list]
    y_train = [sent2labels(s) for s in msra_data.train_tag_list]

    X_test = [sent2features(s) for s in msra_data.test_sentence_list]
    y_test = [sent2labels(s) for s in msra_data.test_tag_list]

    # print(X_train)
    print(len(y_train))

    crf_mode = CRFNerModel()
    # crf_mode.load_model()
    crf_mode.fit(X_train, y_train)

コード例 #2

ファイルを表示

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# Copyright (c) ***
import numpy as np
import torch
import torch.nn as nn
from torch.optim import Optimizer
from transformers import BertModel
from pytorch.layers.crf import CRF
import torch.autograd as autograd
import torch.optim as optim
from pytorch.layers.bert_optimization import BertAdam
from transformers import BertTokenizer
from nlp_applications.data_loader import LoadMsraDataV2

msra_data = LoadMsraDataV2("D:\data\\ner\\msra_ner_token_level\\")
bert_model_name = "bert-base-chinese"
class_num = len(msra_data.label2id)


def sequence_padding(inputs, length=None, padding=0, is_float=False):
    """Numpy函数，将序列padding到同一长度
    """
    if length is None:
        length = max([len(x) for x in inputs])

    outputs = np.array([
        np.concatenate([x, [padding] *
                        (length - len(x))]) if len(x) < length else x[:length]
        for x in inputs
    ])