Python MultiHeadAttention 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: tensorflow_addons.layers

클래스/타입: MultiHeadAttention

hotexamples.com에서의 예제들: 5

Python MultiHeadAttention - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 tensorflow_addons.layers.MultiHeadAttention에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

MultiHeadAttention(4)

get_config(1)

자주 사용되는 메소드들

MultiHeadAttention (4)

get_config (1)

예제 #1

파일 보기

    def __init__(self, d_model, num_heads, dff, rate=0.1):
        super(ConditionalDecoderLayer, self).__init__()

        def point_wise_feed_forward_network(d_model, dff):
            return tf.keras.Sequential([
                tf.keras.layers.Dense(
                    dff, activation='relu'),  # (batch_size, seq_len, dff)
                tf.keras.layers.Dense(
                    d_model)  # (batch_size, seq_len, d_model)
            ])

        self.mha1 = MultiHeadAttention(d_model,
                                       num_heads,
                                       return_attn_coef=True)
        self.mha2 = MultiHeadAttention(d_model,
                                       num_heads,
                                       return_attn_coef=True)

        self.ffn = point_wise_feed_forward_network(d_model, dff)

        self.layernorm1 = tf.keras.layers.LayerNormalization(epsilon=1e-6)
        self.layernorm2 = tf.keras.layers.LayerNormalization(epsilon=1e-6)
        self.layernorm3 = tf.keras.layers.LayerNormalization(epsilon=1e-6)

        self.dropout1 = tf.keras.layers.Dropout(rate)
        self.dropout2 = tf.keras.layers.Dropout(rate)
        self.dropout3 = tf.keras.layers.Dropout(rate)

예제 #2

파일 보기

파일: multihead_self_attention.py 프로젝트: X-CCS/TensorflowTTS-1

 def __init__(self,
              head_size,
              num_heads,
              output_size=None,
              dropout=0.1,
              name="rel_pos_multihead_self_attention",
              **kwargs):
     super(MultiHeadSelfAttention, self).__init__(name=name, **kwargs)
     self.multihead_attention = MultiHeadAttention(head_size=head_size,
                                                   num_heads=num_heads,
                                                   output_size=output_size,
                                                   dropout=dropout)

예제 #3

파일 보기

 def __init__(self, embed_dim, num_heads, ff_dim, rate=0.8):
     super(TransformerBlock, self).__init__()
     self.att = MultiHeadAttention(head_size=embed_dim, num_heads=num_heads)
     self.ffn = Sequential(
         [Dense(ff_dim, activation="relu"), Dense(embed_dim),]
     )
     self.layernorm1 = LayerNormalization(epsilon=1e-6)
     self.layernorm2 = LayerNormalization(epsilon=1e-6)
     self.dropout1 = Dropout(rate)
     self.dropout2 = Dropout(rate)

예제 #4

파일 보기

파일: multihead_self_attention.py 프로젝트: X-CCS/TensorflowTTS-1

class MultiHeadSelfAttention(tf.keras.layers.Layer):
    def __init__(self,
                 head_size,
                 num_heads,
                 output_size=None,
                 dropout=0.1,
                 name="rel_pos_multihead_self_attention",
                 **kwargs):
        super(MultiHeadSelfAttention, self).__init__(name=name, **kwargs)
        self.multihead_attention = MultiHeadAttention(head_size=head_size,
                                                      num_heads=num_heads,
                                                      output_size=output_size,
                                                      dropout=dropout)

    def call(self, inputs, training=False, **kwargs):
        output = self.multihead_attention([inputs, inputs], training=training)
        return output

    def get_config(self):
        conf = super(MultiHeadSelfAttention, self).get_config()
        conf.update(self.multihead_attention.get_config())
        return conf

예제 #5

파일 보기

    def __init__(self,
                 name="AttentionBlock",
                 num_heads=2,
                 head_size=128,
                 ff_dim=None,
                 dropout=0,
                 **kwargs):
        super().__init__(name=name, **kwargs)

        if ff_dim is None:
            ff_dim = head_size

        self.attention = MultiHeadAttention(num_heads=num_heads,
                                            head_size=head_size,
                                            dropout=dropout)
        self.attention_dropout = keras.layers.Dropout(dropout)
        self.attention_norm = keras.layers.LayerNormalization(epsilon=1e-6)

        self.ff_conv1 = keras.layers.Conv1D(filters=ff_dim,
                                            kernel_size=1,
                                            activation="relu")
        # self.ff_conv2 at build()
        self.ff_dropout = keras.layers.Dropout(dropout)
        self.ff_norm = keras.layers.LayerNormalization(epsilon=1e-6)