Python TextConverter.get_en_arrs 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: read_utils

클래스/타입: TextConverter

메소드/함수: get_en_arrs

hotexamples.com에서의 예제들: 2

Python TextConverter.get_en_arrs - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 read_utils.TextConverter.get_en_arrs에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

TextConverter(30)

text_to_arr(25)

arr_to_text(13)

save_to_file(13)

val_samples_generator(4)

batch_generator(4)

load_obj(4)

QAs_to_arr(3)

load_data(2)

texts_to_arr(2)

save_to_excel(2)

libs_to_arrs(2)

QAs_to_arrs(2)

index_to_response(2)

get_en_arrs(2)

int_to_word(1)

int_to_tag(1)

samples_for_train(1)

save(1)

testQAs_to_arrs(1)

text_en_to_arr(1)

get_de_arrs(1)

generate_valid_samples(1)

Q_to_arr(1)

xy_to_number(1)

예제 #1

파일 보기

def main(_):
    model_path = os.path.join('model', Config.file_name)
    if os.path.exists(model_path) is False:
        os.makedirs(model_path)

    et = TextConverter(text=None,
                       save_dir='model/en_vocab.pkl',
                       max_vocab=Config.en_vocab_size,
                       seq_length=Config.seq_length)
    zt = TextConverter(text=None,
                       save_dir='model/zh_vocab.pkl',
                       max_vocab=Config.zh_vocab_size,
                       seq_length=Config.seq_length +
                       1)  # +1是因为，decoder层序列拆成input=[:-1]和label=[1:]
    print('english vocab lens:', et.vocab_size)
    print('chines20000e vocab lens:', zt.vocab_size)

    en_arrs = et.get_en_arrs('data/train.tags.data.en_clear')
    zh_arrs = zt.get_en_arrs('data/train.tags.data.zh_clear')

    train_g = batch_generator(en_arrs, zh_arrs, Config.batch_size)

    # 加载上一次保存的模型
    model = Model(Config)
    checkpoint_path = tf.train.latest_checkpoint(model_path)
    if checkpoint_path:
        model.load(checkpoint_path)

    print('start to training...')
    model.train(train_g, model_path)

예제 #2

파일 보기

파일: train.py 프로젝트: zoulala/Seq2seq_couplet

def main(_):

    model_path = os.path.join('models', Config.file_name)
    if os.path.exists(model_path) is False:
        os.makedirs(model_path)

    converter = TextConverter(vocab_dir='data/vocabs',
                              max_vocab=Config.vocab_size,
                              seq_length=Config.seq_length)
    print('vocab lens:', converter.vocab_size)

    en_arrs = converter.get_en_arrs('data/train/in.txt')
    de_arrs = converter.get_de_arrs('data/train/out.txt')

    train_g = batch_generator(en_arrs, de_arrs, Config.batch_size)

    # 加载上一次保存的模型
    model = Model(Config)
    checkpoint_path = tf.train.latest_checkpoint(model_path)
    if checkpoint_path:
        model.load(checkpoint_path)

    print('start to training...')
    model.train(train_g, model_path)