Python SequenceToSequence 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: seq_to_seq.models

클래스/타입: SequenceToSequence

hotexamples.com에서의 예제들: 2

Python SequenceToSequence - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 seq_to_seq.models.SequenceToSequence에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

train(3)

load_weights(1)

setup(1)

예제 #1

파일 보기

파일: gru_to_gru.py 프로젝트: guxiaodong1987/seq_to_seq

gru3 = GRU(dim_proj, dim_proj, return_sequences=False, seed=seed)
encoder = [emb1, gru1, gru2, gru3]

# define the decoder architecture
emb2 = Embedding(pt_v_size, dim_proj, seed=seed)
gru4 = GRU(dim_proj, dim_proj, seed=seed)
gru5 = GRU(dim_proj, dim_proj, seed=seed)
gru6 = GRU(dim_proj, dim_proj, seed=seed)
decoder = [emb2, gru4, gru5, gru6]

softmax = Softmax(dim_proj, pt_v_size)

# ensemble the sequence-to-sequence model
seq = SequenceToSequence(encoder=encoder,
                         decoder=decoder,
                         output=softmax,
                         source_v_size=en_v_size,
                         target_v_size=pt_v_size)

# set optimizer
optimizer = Adadelta()

# set up the model
seq.setup(batch_size=batch_size, optimizer=optimizer)

time2 = time.time()
print 'Initialization took %3.5f seconds. \n' % (time2 - time1)

model_file = '/home/gian/%s_%shid_prj%s_en%s_pt%s_%s_batch%s.hp5y' % \
             (gru1.__class__.__name__, len(encoder), dim_proj,
              en_v_size, pt_v_size, optimizer.__class__.__name__,

예제 #2

파일 보기

파일: reload_model_example.py 프로젝트: giancds/seq_to_seq

# define the encoder architecture
emb1 = Embedding(en_v_size, dim_proj, seed=seed)
lstm1 = LSTM(dim_proj, dim_proj, seed=seed)
lstm2 = LSTM(dim_proj, dim_proj, return_sequences=False, seed=seed)
encoder = [emb1, lstm1, lstm2]

# define the decoder architecture
emb2 = Embedding(pt_v_size, dim_proj, seed=seed)
lstm3 = LSTM(dim_proj, dim_proj, seed=seed)
lstm4 = LSTM(dim_proj, pt_v_size, seed=seed)
decoder = [emb2, lstm3, lstm4]

# ensemble the sequence-to-sequence model
seq = SequenceToSequence(encoder=encoder,
                         decoder=decoder,
                         source_v_size=en_v_size,
                         target_v_size=pt_v_size,
                         auto_setup=False)  # set auto_setup to false to avoid initialization
                         # (weights will be overwritten anyway)

# load source and target language dictionaries
sr_dict = load_dictionary('/home/gian/datasets/dict.sort.en', max_words=en_v_size)
tr_dict = load_dictionary('/home/gian/datasets/dict.sort.pt', max_words=pt_v_size)

# load the corpora and convert its words to their indexes (corpora must be already tokenized)
sequences1 = load_and_convert_corpora('/home/gian/datasets/fapesp/fapesp-v2.tok.test-a.en', sr_dict)
sequences2 = load_and_convert_corpora('/home/gian/datasets/fapesp/fapesp-v2.tok.test-a.pt', tr_dict)

# prepare the data (add padding values to the end of each sequence so they have the same size)

seq.load_weights('/home/gian/seq_to_seq.hp5y')