Python TransformerEncoderBuilder.n_heads Examples

Programming Language: Python

Namespace/Package Name: fast_transformers.builders

Method/Function: n_heads

Examples at hotexamples.com: 2

Python TransformerEncoderBuilder.n_heads - 2 examples found. These are the top rated real world Python examples of fast_transformers.builders.TransformerEncoderBuilder.n_heads extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

from_kwargs(18)

TransformerEncoderBuilder(4)

n_layers(2)

query_dimensions(2)

n_heads(2)

attention_dropout(1)

get(1)

topk(1)

softmax_temp(1)

rounds(1)

length_limit(1)

iterations(1)

hash_bias(1)

from_namespace(1)

attention_type(1)

activation(1)

from_dictionary(1)

final_normalization(1)

feed_forward_dimensions(1)

feature_map(1)

dropout(1)

clusters(1)

chunk_size(1)

bits(1)

value_dimensions(1)

Example #1

Show file

    def test_simple_build(self):
        transformer = TransformerEncoderBuilder().get()
        builder = TransformerEncoderBuilder()
        builder.n_layers = 1
        builder.n_heads = 4
        builder.attention_type = "linear"
        transformer = builder.get()

        with self.assertRaises(ValueError):
            builder = TransformerEncoderBuilder()
            builder.attention_type = "whatever"

Example #2

Show file

    def test_attention_parameter(self):
        builder = TransformerEncoderBuilder()

        builder.n_layers = 3
        builder.n_heads = 4
        builder.feed_forward_dimensions = 512
        builder.query_dimensions = 32
        builder.value_dimensions = 64
        builder.dropout = 0.1
        builder.activation = "relu"
        builder.final_normalization = True

        # Full attention parameters
        builder.softmax_temp = 1.0
        builder.attention_dropout = 0.1

        # Linear attention parameters
        builder.feature_map = lambda x: (x > 0).float() * x

        # Clustered attention parameters
        builder.clusters = 100
        builder.iterations = 10
        builder.bits = 32
        builder.hash_bias = True

        # Exact topk attention parameters
        builder.topk = 32

        # Conditional attention parameters
        builder.length_limit = 512

        # Reformer attention parameters
        builder.chunk_size = 32
        builder.rounds = 1

        # Add here old parameters to avoid regressions
        invalid = [
            "dropout_rate"
        ]
        for name in invalid:
            with self.assertRaises(AttributeError):
                setattr(builder, name, None)