Python LayerNorm 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: thumt.modules

메소드/함수: LayerNorm

hotexamples.com에서의 예제들: 5

Python LayerNorm - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 thumt.modules.LayerNorm에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: cachedtransformer.py 프로젝트: xyz961014/THUMT-doc

    def __init__(self, params, name="cached_decoder"):
        super().__init__(name=name)

        self.normalization = params.normalization
        self.enable_cache = params.enable_decoder_cache
        self.enable_relative_positional_embedding = params.enable_relative_positional_embedding
        self.query_method = params.tgt_query_method
        self.dropout = params.residual_dropout

        with utils.scope(name):
            self.cache = Cache(params, name="decoder_cache")
            if self.query_method == "single_linear":
                self.query_transform = nn.Sequential(nn.Linear(params.hidden_size, self.cache_dk),
                                                     nn.Tanh())
            self.layers = nn.ModuleList([CachedTransformerDecoderLayer(params, name="layer_%d" % i)
                                         for i in range(params.num_decoder_layers)])
            if params.enable_relative_positional_embedding:
                self.pos_emb = PositionalEmbedding(params.hidden_size)
                self.pos_bias_u = nn.Parameter(torch.Tensor(params.num_heads, params.hidden_size // params.num_heads))
                self.pos_bias_v = nn.Parameter(torch.Tensor(params.num_heads, params.hidden_size // params.num_heads))
                self.add_name(self.pos_bias_u, "pos_bias_u")
                self.add_name(self.pos_bias_v, "pos_bias_v")
            else:
                self.pos_bias_u, self.pos_bias_v = None, None

            if self.normalization == "before":
                self.layer_norm = modules.LayerNorm(params.hidden_size)
            else:
                self.layer_norm = None

        self.reset_parameters()

예제 #2

파일 보기

파일: transformer.py 프로젝트: xyz961014/THUMT-doc

    def __init__(self, params, name="attention"):
        super(AttentionSubLayer, self).__init__(name=name)

        self.dropout = params.residual_dropout
        self.normalization = params.normalization

        with utils.scope(name):
            self.attention = modules.MultiHeadAttention(
                params.hidden_size, params.num_heads, params.attention_dropout)
            self.layer_norm = modules.LayerNorm(params.hidden_size)

예제 #3

파일 보기

파일: transformer.py 프로젝트: xyz961014/THUMT-doc

    def __init__(self, params, dtype=None, name="ffn_layer"):
        super(FFNSubLayer, self).__init__(name=name)

        self.dropout = params.residual_dropout
        self.normalization = params.normalization

        with utils.scope(name):
            self.ffn_layer = modules.FeedForward(params.hidden_size,
                                                 params.filter_size,
                                                 dropout=params.relu_dropout)
            self.layer_norm = modules.LayerNorm(params.hidden_size)

예제 #4

파일 보기

    def __init__(self, params, name="encoder"):
        super(TransformerEncoder, self).__init__(name=name)

        self.normalization = params.normalization

        with utils.scope(name):
            self.layers = nn.ModuleList([
                TransformerEncoderLayer(params, name="layer_%d" % i)
                for i in range(params.num_encoder_layers)])
            if self.normalization == "before":
                self.layer_norm = modules.LayerNorm(params.hidden_size)
            else:
                self.layer_norm = None

예제 #5

파일 보기

파일: cachedtransformer.py 프로젝트: xyz961014/THUMT-doc

    def __init__(self, params, name="learnableselfattention"):
        super().__init__(name=name)

        self.dropout = params.residual_dropout
        self.normalization = params.normalization
        self.gated = params.enable_residual_gate
        if self.gated:
            hidden_size = params.hidden_size
            self.W_x = Affine(hidden_size, hidden_size, name="W_x")
            self.W_y = Affine(hidden_size, hidden_size, name="W_y")

        with utils.scope(name):
            self.attention = modules.LearnableMultiHeadSelfAttention(params.hidden_size, 
                                                                     params.num_heads, 
                                                                     params.attention_dropout,
                                                                     params.enable_relative_positional_embedding,
                                                                     params.enable_sentence_embedding)
            self.layer_norm = modules.LayerNorm(params.hidden_size)