Python BertModel.shared Beispiele

Programmiersprache: Python

Namespace / Paketname: transformers

Klasse / Typ: BertModel

Methode / Funktion: shared

Beispiele auf hotexamples.com: 1

Python BertModel.shared - 1 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die transformers.BertModel.shared, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

BertModel(30)

from_pretrained(30)

parameters(30)

eval(21)

to(19)

load_state_dict(18)

named_parameters(11)

state_dict(9)

train(7)

embeddings(6)

set_input_embeddings(5)

cuda(5)

get_extended_attention_mask(4)

get_input_embeddings(3)

forward(3)

save_pretrained(3)

__init__(2)

encoder(2)

from_config(1)

named_modules(1)

pooler(1)

resize_token_embeddings(1)

shared(1)

apply(1)

init_weights(1)

Beispiel #1

Datei anzeigen

    def apply(self,
              input_ids,
              input_mask,
              type_ids,
              masked_lm_positions=None,
              masked_lm_labels=None,
              masked_lm_weights=None,
              next_sentence_labels=None,
              *,
              config,
              deterministic=False):
        """Applies BERT for pre-training."""
        bert = BertModel.shared(config=config, name='bert')
        sequence_output, pooled_output = bert(input_ids,
                                              input_mask,
                                              type_ids,
                                              deterministic=deterministic)
        if masked_lm_positions is None:
            return sequence_output, pooled_output

        # Masked LM
        masked_lm_input = GatherIndexes(sequence_output, masked_lm_positions)
        masked_lm_input = nn.Dense(masked_lm_input,
                                   config.hidden_size,
                                   kernel_init=get_kernel_init(config),
                                   name='predictions_transform_dense')
        masked_lm_input = get_hidden_activation(config)(masked_lm_input)
        masked_lm_input = nn.LayerNorm(masked_lm_input,
                                       epsilon=LAYER_NORM_EPSILON,
                                       name='predictions_transform_layernorm')
        masked_lm_logits = layers.OutputProjection(
            masked_lm_input,
            kernel=bert.get_embedding_table(),
            name='predictions_output')

        # Next-sentence prediction
        next_sentence_logits = layers.OutputProjection(
            pooled_output,
            n_out=2,
            kernel_init=get_kernel_init(config),
            name='classification')

        if masked_lm_labels is None or next_sentence_labels is None:
            return masked_lm_logits, next_sentence_logits
        else:
            return self._compute_metrics(masked_lm_logits,
                                         next_sentence_logits,
                                         masked_lm_labels, masked_lm_weights,
                                         next_sentence_labels)