Ejemplos de PretrainedTransformerIndexer.determine_num_special_tokens_added en Python

Lenguaje de programación: Python

Namespace/Package Name: allennlp.data.token_indexers

Clase / Tipo: PretrainedTransformerIndexer

Método / Función: determine_num_special_tokens_added

Ejemplos en hotexamples.com: 3

Python PretrainedTransformerIndexer.determine_num_special_tokens_added - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de allennlp.data.token_indexers.PretrainedTransformerIndexer.determine_num_special_tokens_added extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

PretrainedTransformerIndexer(30)

tokens_to_indices(16)

as_padded_tensor_dict(5)

_add_encoding_to_vocabulary_if_needed(3)

count_vocab_items(3)

determine_num_special_tokens_added(3)

get_empty_token_list(3)

_postprocess_output(2)

as_padded_tensor(1)

indices_to_tokens(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: pretrained_transformer_embedder.py Proyecto: taryou/allennlp

    def __init__(self, model_name: str, max_length: int = None) -> None:
        super().__init__()
        self.transformer_model = AutoModel.from_pretrained(model_name)
        self._max_length = max_length
        # I'm not sure if this works for all models; open an issue on github if you find a case
        # where it doesn't work.
        self.output_dim = self.transformer_model.config.hidden_size

        tokenizer = AutoTokenizer.from_pretrained(model_name)
        (
            self._num_added_start_tokens,
            self._num_added_end_tokens,
        ) = PretrainedTransformerIndexer.determine_num_special_tokens_added(tokenizer)
        self._num_added_tokens = self._num_added_start_tokens + self._num_added_end_tokens

Ejemplo n.º 2

Mostrar archivo

    def __init__(self,
                 model_name: str,
                 max_length: int = None,
                 layer_dropout: float = 0.0,
                 bert_dropout: float = 0.0,
                 dropout: float = 0.0,
                 combine_layers: str = "mix",
                 adapter_size: int = 8,
                 pretrained: bool = True) -> None:
        super().__init__()
        placeholder = model_name.split("_")
        tokenizer_name = placeholder[-1]
        self.transformer_model = PretrainedAutoModel.load(
            model_name,
            tokenizer_name,
            adapter_size=adapter_size,
            pretrained=pretrained)
        self._max_length = max_length
        # I'm not sure if this works for all models; open an issue on github if you find a case
        # where it doesn't work.
        self.output_dim = self.transformer_model.config.hidden_size
        self.combine_layers = combine_layers

        if self.combine_layers == "mix":
            self._scalar_mix = ScalarMixWithDropout(
                self.transformer_model.config.num_hidden_layers,
                do_layer_norm=False,
                dropout=layer_dropout)
        else:
            self._scalar_mix = None

        self._bert_dropout = InputVariationalDropout(bert_dropout)
        self.set_dropout(dropout)

        tokenizer = PretrainedAutoTokenizer.load(tokenizer_name)
        (
            self._num_added_start_tokens,
            self._num_added_end_tokens,
        ) = PretrainedTransformerIndexer.determine_num_special_tokens_added(
            tokenizer)
        self._num_added_tokens = self._num_added_start_tokens + self._num_added_end_tokens

Ejemplo n.º 3

Mostrar archivo

 def test_determine_num_special_tokens_added(self):
     tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
     assert PretrainedTransformerIndexer.determine_num_special_tokens_added(
         tokenizer) == (1, 1)