Python PreTrainedModel.from_pretrained 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: transformers

클래스/타입: PreTrainedModel

메소드/함수: from_pretrained

hotexamples.com에서의 예제들: 2

Python PreTrainedModel.from_pretrained - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 transformers.PreTrainedModel.from_pretrained에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

eval(30)

parameters(18)

zero_grad(16)

train(16)

named_parameters(15)

to(12)

resize_token_embeddings(8)

generate(5)

save_pretrained(4)

get_input_embeddings(3)

from_pretrained(2)

set_input_embeddings(2)

load_state_dict(2)

_tie_encoder_decoder_weights(2)

num_parameters(2)

state_dict(2)

cuda(1)

forward(1)

prepare_inputs_for_generation(1)

lm_head(1)

get_encoder(1)

__init__(1)

예제 #1

파일 보기

파일: utils.py 프로젝트: ohmeow/blurr

def get_hf_objects(
    pretrained_model_name_or_path: Optional[Union[str, os.PathLike]],
    model_cls: PreTrainedModel,
    config: Union[PretrainedConfig, str, os.PathLike] = None,
    tokenizer_cls: PreTrainedTokenizerBase = None,
    config_kwargs: dict = {},
    tokenizer_kwargs: dict = {},
    model_kwargs: dict = {},
    cache_dir: Union[str, os.PathLike] = None
) -> Tuple[str, PretrainedConfig, PreTrainedTokenizerBase, PreTrainedModel]:
    """
    Given at minimum a `pretrained_model_name_or_path` and `model_cls (such as
    `AutoModelForSequenceClassification"), this method returns all the Hugging Face objects you need to train
    a model using Blurr
    """
    # config
    if config is None:
        config = AutoConfig.from_pretrained(pretrained_model_name_or_path,
                                            cache_dir=cache_dir,
                                            **config_kwargs)

    # tokenizer (gpt2, roberta, bart (and maybe others) tokenizers require a prefix space)
    if any(s in pretrained_model_name_or_path
           for s in ["gpt2", "roberta", "bart", "longformer"]):
        tokenizer_kwargs = {**{"add_prefix_space": True}, **tokenizer_kwargs}

    if tokenizer_cls is None:
        tokenizer = AutoTokenizer.from_pretrained(
            pretrained_model_name_or_path,
            cache_dir=cache_dir,
            **tokenizer_kwargs)
    else:
        tokenizer = tokenizer_cls.from_pretrained(
            pretrained_model_name_or_path,
            cache_dir=cache_dir,
            **tokenizer_kwargs)

    # model
    model = model_cls.from_pretrained(pretrained_model_name_or_path,
                                      config=config,
                                      cache_dir=cache_dir,
                                      **model_kwargs)

    # arch
    try:
        arch = model.__module__.split(".")[2]
    except:
        arch = "unknown"

    return (arch, config, tokenizer, model)

예제 #2

파일 보기

파일: transformer.py 프로젝트: brunovilar/pt_br_tweets_sentiment_analysis

    def __init__(self,
                 pretrained_model_class: PreTrainedModel,
                 pretrained_model_name: str,
                 extra_layers: List[int],
                 dropout_layers: List[float] = None,
                 freeze: bool = False):
        """
        @param  pretrained_model_class: an object of a pre trained model class (e.g., BertModel)
        @param  pretrained_model_name: a pretrained model path (e.g., 'neuralmind/bert-base-portuguese-cased')
        @param  freeze (bool): whether the model should be fine tuned (True) or not (False).
        """
        super(TransformerClassifier, self).__init__()
        # Instantiate  model
        self.model = pretrained_model_class.from_pretrained(
            pretrained_model_name)

        dropout_layers = dropout_layers or [0. for _ in extra_layers]
        assert len(extra_layers) == len(
            dropout_layers
        ), 'Extra Layers and Dropout Layers should have the same length'

        # Adds the size of the output layer
        all_layers = [self.model.config.hidden_size] + extra_layers + [3]
        dropout_layers = [0.] + dropout_layers + [0.]
        # Instantiate layers based on the sizes received
        layers_instances = fp.lflatten(
            [[nn.Linear(prev, layer), nn.ReLU()] +
             ([nn.Dropout(dropout_layers[i])] if dropout_layers[i] > 0 else [])
             for i, (layer, prev) in enumerate(fp.with_prev(all_layers))
             if prev])
        layers_instances = layers_instances[:-1]  # Remove the last ReLU added.
        self.classifier = nn.Sequential(*layers_instances)

        if freeze:
            for param in self.model.parameters():
                param.requires_grad = False