Python GPipeTransformerStack.Params 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: lingvo.core.layers_with_gpipe

메소드/함수: Params

hotexamples.com에서의 예제들: 3

Python GPipeTransformerStack.Params - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 lingvo.core.layers_with_gpipe.GPipeTransformerStack.Params에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

GPipeTransformerStack(13)

FProp(11)

EncoderFPropDefaultTheta(7)

Params(3)

예제 #1

파일 보기

  def _TransformerParamsWithEmbeddings(self,
                                       num_decoder_layers=0,
                                       num_encoder_layers=4,
                                       splits=1,
                                       num_micro_batches=1):
    model_dim = 4
    params = GPipeTransformerStack.Params()
    params.name = 'transformer'
    params.model_dim = model_dim
    params.num_decoder_layers = num_decoder_layers
    params.decoder_tpl.tr_atten_tpl.num_attention_heads = 1
    params.decoder_tpl.tr_fflayer_tpl.hidden_dim = model_dim
    params.num_encoder_layers = num_encoder_layers
    params.encoder_tpl.tr_atten_tpl.num_attention_heads = 1
    params.encoder_tpl.tr_fflayer_tpl.hidden_dim = model_dim
    params.num_micro_batches = num_micro_batches
    params.use_pipelined_embeddings = True
    params.state_dtype = tf.float32

    emb_params = params.emb_tpl
    # Default config for the token embedding.
    emb_params.token_emb.use_matmul = True
    emb_params.token_emb.use_3d_weight_tensor = False
    emb_params.token_emb.vocab_size = 10
    emb_params.token_emb.embedding_dim = model_dim

    # Default config for the position embedding.
    emb_params.position_emb.embedding_dim = model_dim
    emb_params.position_emb.trainable_scaling = False
    params.splits = splits
    params.random_seed = 0
    return params

예제 #2

파일 보기

파일: layers_with_gpipe_test.py 프로젝트: lizheng-1/lingvo

def _TransformerParamsWithEmbeddings(num_decoder_layers=0,
                                     num_encoder_layers=4,
                                     splits=1,
                                     num_micro_batches=1,
                                     has_softmax=False,
                                     use_task_ids=False):
    model_dim = 4
    params = GPipeTransformerStack.Params()
    params.name = 'transformer'
    params.model_dim = model_dim
    params.num_decoder_layers = num_decoder_layers
    params.decoder_tpl.source_dim = model_dim
    params.decoder_tpl.tr_atten_tpl.num_attention_heads = 1
    params.decoder_tpl.tr_fflayer_tpl.hidden_dim = model_dim
    params.num_encoder_layers = num_encoder_layers
    params.encoder_tpl.source_dim = model_dim
    params.encoder_tpl.tr_atten_tpl.num_attention_heads = 1
    params.encoder_tpl.tr_fflayer_tpl.hidden_dim = model_dim
    params.num_micro_batches = num_micro_batches
    params.state_dtype = tf.float32
    if has_softmax:
        params.softmax_tpl.input_dim = model_dim
        params.softmax_tpl.num_classes = 2
    else:
        params.softmax_tpl = None

    emb_params = params.emb_tpl
    # Default config for the token embedding.
    emb_params.token_emb.use_matmul = True
    emb_params.token_emb.use_3d_weight_tensor = False
    emb_params.token_emb.vocab_size = 10
    emb_params.token_emb.embedding_dim = model_dim

    # Default config for the position embedding.
    emb_params.position_emb.embedding_dim = model_dim
    emb_params.position_emb.trainable_scaling = False

    # Task embeddings.
    if use_task_ids:
        emb_params.enc_task_emb = emb_params.token_emb.Copy()
        emb_params.dec_task_emb = emb_params.token_emb.Copy()
    params.splits = splits
    params.random_seed = 0
    return params

예제 #3

파일 보기

 def _TransformerParams(self,
                        num_decoder_layers=0,
                        num_encoder_layers=4,
                        splits=1,
                        num_micro_batches=1):
     model_dim = 2
     params = GPipeTransformerStack.Params()
     params.name = 'transformer'
     params.model_dim = model_dim
     params.num_decoder_layers = num_decoder_layers
     params.decoder_tpl.tr_atten_tpl.num_attention_heads = 1
     params.decoder_tpl.tr_fflayer_tpl.hidden_dim = model_dim
     params.num_encoder_layers = num_encoder_layers
     params.encoder_tpl.tr_atten_tpl.num_attention_heads = 1
     params.encoder_tpl.tr_fflayer_tpl.hidden_dim = model_dim
     params.num_micro_batches = num_micro_batches
     params.splits = splits
     params.random_seed = 0
     return params