Esempi in Python per TransformerEncoderBuilder.n_heads

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: fast_transformers.builders

Classe/tipologia: TransformerEncoderBuilder

Metodo/funzione: n_heads

Esempi su hotexamples.com: 2

TransformerEncoderBuilder.n_heads in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per fast_transformers.builders.TransformerEncoderBuilder.n_heads, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

from_kwargs(18)

TransformerEncoderBuilder(4)

n_layers(2)

query_dimensions(2)

n_heads(2)

attention_dropout(1)

get(1)

topk(1)

softmax_temp(1)

rounds(1)

length_limit(1)

iterations(1)

hash_bias(1)

from_namespace(1)

attention_type(1)

activation(1)

from_dictionary(1)

final_normalization(1)

feed_forward_dimensions(1)

feature_map(1)

dropout(1)

clusters(1)

chunk_size(1)

bits(1)

value_dimensions(1)

Esempio n. 1

Mostra file

    def test_simple_build(self):
        transformer = TransformerEncoderBuilder().get()
        builder = TransformerEncoderBuilder()
        builder.n_layers = 1
        builder.n_heads = 4
        builder.attention_type = "linear"
        transformer = builder.get()

        with self.assertRaises(ValueError):
            builder = TransformerEncoderBuilder()
            builder.attention_type = "whatever"

Esempio n. 2

Mostra file

    def test_attention_parameter(self):
        builder = TransformerEncoderBuilder()

        builder.n_layers = 3
        builder.n_heads = 4
        builder.feed_forward_dimensions = 512
        builder.query_dimensions = 32
        builder.value_dimensions = 64
        builder.dropout = 0.1
        builder.activation = "relu"
        builder.final_normalization = True

        # Full attention parameters
        builder.softmax_temp = 1.0
        builder.attention_dropout = 0.1

        # Linear attention parameters
        builder.feature_map = lambda x: (x > 0).float() * x

        # Clustered attention parameters
        builder.clusters = 100
        builder.iterations = 10
        builder.bits = 32
        builder.hash_bias = True

        # Exact topk attention parameters
        builder.topk = 32

        # Conditional attention parameters
        builder.length_limit = 512

        # Reformer attention parameters
        builder.chunk_size = 32
        builder.rounds = 1

        # Add here old parameters to avoid regressions
        invalid = [
            "dropout_rate"
        ]
        for name in invalid:
            with self.assertRaises(AttributeError):
                setattr(builder, name, None)