Python Language.set_vocab 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: dataset

클래스/타입: Language

메소드/함수: set_vocab

hotexamples.com에서의 예제들: 2

Python Language.set_vocab - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 dataset.Language.set_vocab에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Language(5)

build_vocab(5)

set_vocab(2)

자주 사용되는 메소드들

Language (5)

build_vocab (5)

set_vocab (2)

예제 #1

파일 보기

파일: run.py 프로젝트: shwksl101/LG_AI_CAMP

def translate():
    SOS = Language.SOS_TOKEN_IDX
    EOS = Language.EOS_TOKEN_IDX

    french_train = Language(path='data/train.fr.txt')
    english_train = Language(path='data/train.en.txt')
    french_train.build_vocab()
    english_train.build_vocab()
    model = Seq2Seq(french_train,
                    english_train,
                    attention_type=attention_type,
                    embedding_dim=embedding_dim,
                    hidden_dim=hidden_dim).to(device)
    model.load_state_dict(
        torch.load("seq2seq_" + attention_type + ".pth", map_location=device))

    french_test = Language(path='data/test.fr.txt')
    english_test = Language(path='data/test.en.txt')
    french_test.set_vocab(french_train.word2idx, french_train.idx2word)
    english_test.set_vocab(english_train.word2idx, english_train.idx2word)
    dataset = NmtDataset(src=french_test, trg=english_test)

    samples = [dataset[0][0], dataset[1][0],
               dataset[2][0]]  # You may choose your own samples to plot

    for i, french in enumerate(samples):
        translated, attention = model.translate(
            torch.Tensor(french).to(dtype=torch.long, device=device))
        source_text = [french_train.idx2word[idx] for idx in french]
        translated_text = [english_train.idx2word[idx] for idx in translated]
        plot_attention(attention.cpu().detach(),
                       translated_text,
                       source_text,
                       name=attention_type + '_' + str(i))

    f = open('translated.txt', mode='w', encoding='utf-8')
    f_bleu = open('pred.en.txt', mode='w', encoding='utf-8')
    for french, english in tqdm(dataset, desc='Translated'):
        translated, attention = model.translate(
            torch.Tensor(french).to(dtype=torch.long, device=device))
        source_text = [french_train.idx2word[idx] for idx in french]
        target_text = [
            english_train.idx2word[idx] for idx in english
            if idx != SOS and idx != EOS
        ]
        translated_text = [
            english_train.idx2word[idx] for idx in translated if idx != EOS
        ]

        f.write('French    : ' + ' '.join(source_text) + '\n')
        f.write('English   : ' + ' '.join(target_text) + '\n')
        f.write('Translated: ' + ' '.join(translated_text) + '\n\n')
        f_bleu.write(' '.join(translated_text) + '\n')
    f.close()
    f_bleu.close()

예제 #2

파일 보기

if __name__ == "__main__":
    french_train = Language(path='data/train.fr.txt')
    english_train = Language(path='data/train.en.txt')
    french_train.build_vocab()
    english_train.build_vocab()
    model = Seq2Seq(french_train,
                    english_train,
                    attention_type=attention_type,
                    embedding_dim=embedding_dim,
                    hidden_dim=hidden_dim).to(device)
    model.load_state_dict(
        torch.load("seq2seq_" + attention_type + ".pth", map_location=device))

    french_test = Language(path='data/test.fr.txt')
    english_test = Language(path='data/test.en.txt')
    french_test.set_vocab(french_train.word2idx, french_train.idx2word)
    english_test.set_vocab(english_train.word2idx, english_train.idx2word)
    dataset = NmtDataset(src=french_test, trg=english_test)

    samples = [dataset[0][0], dataset[1][0],
               dataset[2][0]]  # You may choose your own samples to plot

    for i, french in enumerate(samples):
        translated, attention = model.translate(
            torch.Tensor(french).to(dtype=torch.long, device=device))
        source_text = [french_train.idx2word[idx] for idx in french]
        translated_text = [english_train.idx2word[idx] for idx in translated]
        plot_attention(attention.cpu().detach(),
                       translated_text,
                       source_text,
                       name=attention_type + '_' + str(i))