Python TextConverter.val_samples_generator 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: read_utils

클래스/타입: TextConverter

메소드/함수: val_samples_generator

hotexamples.com에서의 예제들: 4

Python TextConverter.val_samples_generator - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 read_utils.TextConverter.val_samples_generator에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

TextConverter(30)

text_to_arr(25)

arr_to_text(13)

save_to_file(13)

val_samples_generator(4)

batch_generator(4)

load_obj(4)

QAs_to_arr(3)

load_data(2)

texts_to_arr(2)

save_to_excel(2)

libs_to_arrs(2)

QAs_to_arrs(2)

index_to_response(2)

get_en_arrs(2)

int_to_word(1)

int_to_tag(1)

samples_for_train(1)

save(1)

testQAs_to_arrs(1)

text_en_to_arr(1)

get_de_arrs(1)

generate_valid_samples(1)

Q_to_arr(1)

xy_to_number(1)

예제 #1

파일 보기

파일: train.py 프로젝트: zoulala/SegPosNer_Bilstm_CRF

def main(_):

    model_path = os.path.join('models', Config.file_name)
    if os.path.exists(model_path) is False:
        os.makedirs(model_path)

    # train_file = 'data/train.txt'
    # train_file = 'data/train.0926.label'
    # dev_file = 'data/slotlabel3400'
    train_file = sys.argv[1]
    dev_file = sys.argv[2]

    save_file = os.path.join(model_path, 'vocab_tuples.pkl')

    # 获取样本数据
    sens_tags_train = get_sens_tags(train_file)
    sens_tags_val = get_sens_tags(dev_file)

    # sens_tags = get_sens_tags(train_file)
    #
    # sens_tags_train = sens_tags[10000:]
    # sens_tags_val = sens_tags[:10000]

    # 数据处理
    converter = TextConverter(train_file,
                              save_file,
                              max_vocab=Config.vocab_max_size)
    print('vocab size:', converter.vocab_size)
    Config.num_classes = converter.tag_size + 1

    # 产生训练样本
    train_QA_arrs = converter.QAs_to_arr(sens_tags_train, Config.seq_length)
    train_g = converter.batch_generator(train_QA_arrs, Config.batch_size)

    # 产生验证样本
    val_QA_arrs = converter.QAs_to_arr(sens_tags_val, Config.seq_length)
    val_g = converter.val_samples_generator(val_QA_arrs, Config.batch_size)

    # 加载上一次保存的模型
    model = Model(Config, converter.vocab_size)
    checkpoint_path = tf.train.latest_checkpoint(model_path)
    if checkpoint_path:
        model.load(checkpoint_path)

    print('start to training...')
    model.train(train_g, model_path, val_g)

예제 #2

파일 보기

def main(_):

    model_path = os.path.join('models', Config.file_name)
    if os.path.exists(model_path) is False:
        os.makedirs(model_path)

    input_file = 'data/去除2和null.xlsx'
    vocab_file = os.path.join(model_path, 'vocab_label.pkl')

    # 获取原始excel数据
    QAs = get_excel_QAs(
        input_file)  # 要求excel文件格式，第一个表，第一列id，第二列query,第三列response

    # 分配训练和验证数据集
    thres = int(0.8 * len(QAs))
    train_QAs = QAs[:thres]
    val_QAs = QAs[thres:]

    # 数据处理
    text = get_QAs_text(train_QAs)
    converter = TextConverter(text,
                              vocab_file,
                              max_vocab=Config.vocab_max_size,
                              seq_length=Config.seq_length)
    print('vocab size:', converter.vocab_size)

    # 产生训练样本
    train_QA_arrs = converter.QAs_to_arr(train_QAs)
    train_g = converter.batch_generator(train_QA_arrs, Config.batch_size)

    # 产生验证样本
    val_QA_arrs = converter.QAs_to_arr(val_QAs)
    val_g = converter.val_samples_generator(val_QA_arrs, Config.batch_size)

    # 加载上一次保存的模型
    model = Model(Config, converter.vocab_size)
    checkpoint_path = tf.train.latest_checkpoint(model_path)
    if checkpoint_path:
        model.load(checkpoint_path)

    print('start to training...')
    model.train(train_g, model_path, val_g)

예제 #3

파일 보기

파일: train_rnn_attention.py 프로젝트: zoulala/text_classify

    # 数据处理
    converter = TextConverter(train_files,
                              save_file,
                              max_vocab=Config.vocab_size,
                              seq_length=Config.seq_length)
    print('vocab size:', converter.vocab_size)
    print('labels:', converter.label)

    train_texts, train_labels = converter.load_data(train_files)
    train_x, train_x_len, train_y = converter.texts_to_arr(
        train_texts, train_labels)

    val_texts, val_labels = converter.load_data(val_files)
    val_x, val_x_len, val_y = converter.texts_to_arr(val_texts, val_labels)

    # 产生训练样本
    train_g = converter.batch_generator(train_x, train_x_len, train_y,
                                        Config.batch_size)
    val_g = converter.val_samples_generator(val_x, val_x_len, val_y,
                                            Config.batch_size)

    model = Model(Config)

    # 加载上一次保存的模型
    checkpoint_path = tf.train.latest_checkpoint(model_path)
    if checkpoint_path:
        model.load(checkpoint_path)

    print('start to training...')
    model.train(train_g, model_path, val_g)

예제 #4

파일 보기

파일: test_rnn_attention.py 프로젝트: zoulala/text_classify

    train_files = '../data/cnews.train.txt'
    val_files = '../data/cnews.val.txt'
    test_files = '../data/cnews.test.txt'
    save_file = 'cnews.vocab_label.pkl'

    # 数据处理
    converter = TextConverter(train_files,
                              save_file,
                              max_vocab=Config.vocab_size,
                              seq_length=Config.seq_length)
    print('vocab size:', converter.vocab_size)
    print('labels:', converter.label)

    test_texts, test_labels = converter.load_data(test_files)
    test_x, test_x_len, test_y = converter.texts_to_arr(
        test_texts, test_labels)

    test_g = converter.val_samples_generator(test_x, test_x_len, test_y,
                                             Config.batch_size)

    model = Model(Config)

    # 加载上一次保存的模型
    checkpoint_path = tf.train.latest_checkpoint(model_path)
    if checkpoint_path:
        model.load(checkpoint_path)

    print('start to testing...')
    model.test(test_g)