Python MoE1D примеры использования

Язык программирования: Python

Пространство имен/Пакет: mesh_tensorflow.transformer.moe

Метод/Функция: MoE1D

Примеров на hotexamples.com: 4

Python MoE1D - 4 примера найдено. Это лучшие примеры Python кода для mesh_tensorflow.transformer.moe.MoE1D, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Пример #1

Показать файл

Файл: mtf_transformer2.py Проект: sheep-for/tensor2tensor

def mtf_unitransformer_all_layers_tiny():
  """Test out all the layers on local CPU."""
  hparams = mtf_unitransformer_tiny()
  hparams.layer_stack = transformer.LayerStack(
      [transformer_layers.SelfAttention(num_heads=4),
       transformer_layers.LocalSelfAttention(num_heads=4),
       moe.MoE1D(num_experts=4, hidden_size=512),
       moe.MoE2D(expert_x=4, expert_y=4, hidden_size=512),
       transformer_layers.DenseReluDense(hidden_size=512)])
  return hparams

Пример #2

Показать файл

Файл: mtf_transformer2.py Проект: yoyo-yun/tensor2tensor

def mtf_transformer2_all_layers_tiny():
    """Test out all the layers on local CPU."""
    hparams = mtf_transformer2_base()
    hparams.batch_size = 2
    hparams.mesh_shape = ""
    hparams.d_model = 128
    hparams.layer_stack = transformer.LayerStack([
        transformer_layers.SelfAttention(num_heads=4),
        transformer_layers.LocalSelfAttention(num_heads=4),
        moe.MoE1D(num_experts=4, hidden_size=512),
        moe.MoE2D(expert_x=4, expert_y=4, hidden_size=512),
        transformer_layers.DenseReluDense(hidden_size=512)
    ])
    return hparams

Пример #3

Показать файл

def moe_1d_layer(hparams, prefix):
    del prefix
    return moe.MoE1D(num_experts=hparams.moe_num_experts,
                     hidden_size=hparams.moe_hidden_size)

Пример #4

Показать файл

Файл: mtf_transformer2.py Проект: fqararyah/tensor2tensor_some_benchs

def moe_1d_layer(hparams, prefix):
    del prefix
    return moe.MoE1D(num_experts=hparams.moe_num_experts,
                     model_d=hparams.moe_model_d)