Python Encoder.train 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: seq2seq

클래스/타입: Encoder

메소드/함수: train

hotexamples.com에서의 예제들: 2

Python Encoder.train - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 seq2seq.Encoder.train에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Encoder(20)

load_state_dict(6)

eval(4)

parameters(3)

state_dict(3)

cuda(2)

to(2)

train(2)

forward(1)

get_predict_model(1)

initialize_hidden_state(1)

load_states(1)

zero_grad(1)

예제 #1

파일 보기

    '''
    
    loss_function = nn.NLLLoss(reduction = 'sum', ignore_index = de_vocab.item2index['_PAD_'])
    en_optimizer = optim.Adam(encoder.parameters(), lr = 1e-3, weight_decay = 0)
    de_optimizer = optim.Adam(decoder.parameters(), lr = 1e-3, weight_decay = 0)
    
    if use_cuda:
        encoder = encoder.cuda()
        decoder = decoder.cuda()
        ones_matrix = ones_matrix.cuda()
        loss_function = loss_function.cuda()
        
    for epoch in range(20):
        
        pl.reset()
        encoder.train()
        decoder.train()
        total_loss = torch.Tensor([0])
        total_token = 0

        for batch_idx, (en_seq, en_seq_len, de_seq, de_seq_len) in enumerate(pl.gen_pairs(batch_size)):

            en_optimizer.zero_grad()
            de_optimizer.zero_grad()

            en_seq = torch.LongTensor(en_seq)
            de_seq = torch.LongTensor(de_seq)
            if use_cuda:
                en_seq = en_seq.cuda()
                de_seq = de_seq.cuda()

예제 #2

파일 보기

tst_tgt_t = torch.LongTensor(tst_tgt_p)
trn_src_t = torch.LongTensor(trn_src_p)
trn_tgt_t = torch.LongTensor(trn_tgt_p)

enc = Encoder(len(vocab), 100, 100, 2, 'cuda', vocab[pad])
dec = Decoder(len(vocab), 100, 100, 2, 'cuda', vocab[pad], vocab[sos],
              vocab[eos], vocab[unk])
enc.to('cuda')
dec.to('cuda')
opt_enc = torch.optim.Adam(enc.parameters())
opt_dec = torch.optim.Adam(dec.parameters())

n_batch = len(trn_src_p) // batch_size

for e in range(epochs):
    enc.train()
    dec.train()
    epoch_loss = 0
    for i in range(n_batch):
        opt_enc.zero_grad()
        opt_dec.zero_grad()
        lengths = torch.LongTensor(l_trn_src[batch_size * i:batch_size *
                                             (i + 1)])
        out, h_n = enc(trn_src_t[batch_size * i:batch_size * (i + 1)], lengths)
        output = dec.teacher_force(
            trn_tgt_t[batch_size * i:batch_size * (i + 1)].reshape(
                [batch_size, tgt_max, 1]), h_n,
            torch.LongTensor(l_trn_tgt[batch_size * i:batch_size * (i + 1)]))
        loss = 0
        for o, l, t in zip(output,
                           l_trn_tgt[batch_size * i:batch_size * (i + 1)],