Ejemplos de MoE1D en Python

Lenguaje de programación: Python

Namespace/Package Name: mesh_tensorflow.transformer.moe

Método / Función: MoE1D

Ejemplos en hotexamples.com: 4

Python MoE1D - 4 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de mesh_tensorflow.transformer.moe.MoE1D extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

Archivo: mtf_transformer2.py Proyecto: sheep-for/tensor2tensor

def mtf_unitransformer_all_layers_tiny():
  """Test out all the layers on local CPU."""
  hparams = mtf_unitransformer_tiny()
  hparams.layer_stack = transformer.LayerStack(
      [transformer_layers.SelfAttention(num_heads=4),
       transformer_layers.LocalSelfAttention(num_heads=4),
       moe.MoE1D(num_experts=4, hidden_size=512),
       moe.MoE2D(expert_x=4, expert_y=4, hidden_size=512),
       transformer_layers.DenseReluDense(hidden_size=512)])
  return hparams

Ejemplo n.º 2

Mostrar archivo

Archivo: mtf_transformer2.py Proyecto: yoyo-yun/tensor2tensor

def mtf_transformer2_all_layers_tiny():
    """Test out all the layers on local CPU."""
    hparams = mtf_transformer2_base()
    hparams.batch_size = 2
    hparams.mesh_shape = ""
    hparams.d_model = 128
    hparams.layer_stack = transformer.LayerStack([
        transformer_layers.SelfAttention(num_heads=4),
        transformer_layers.LocalSelfAttention(num_heads=4),
        moe.MoE1D(num_experts=4, hidden_size=512),
        moe.MoE2D(expert_x=4, expert_y=4, hidden_size=512),
        transformer_layers.DenseReluDense(hidden_size=512)
    ])
    return hparams

Ejemplo n.º 3

Mostrar archivo

def moe_1d_layer(hparams, prefix):
    del prefix
    return moe.MoE1D(num_experts=hparams.moe_num_experts,
                     hidden_size=hparams.moe_hidden_size)

Ejemplo n.º 4

Mostrar archivo

Archivo: mtf_transformer2.py Proyecto: fqararyah/tensor2tensor_some_benchs

def moe_1d_layer(hparams, prefix):
    del prefix
    return moe.MoE1D(num_experts=hparams.moe_num_experts,
                     model_d=hparams.moe_model_d)