Exemplos de BertConfig.is_decoder em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: transformers

Classe / Tipo: BertConfig

Método / Função: is_decoder

Exemplos em hotexamples.com: 5

BertConfig.is_decoder em Python - 5 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de transformers.BertConfig.is_decoder em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

from_json_file(30)

from_pretrained(30)

BertConfig(28)

output_hidden_states(18)

vocab_size(13)

num_hidden_layers(9)

max_position_embeddings(7)

get_config_dict(6)

is_decoder(5)

hidden_size(5)

num_attention_heads(4)

save_pretrained(4)

add_cross_attention(4)

checkpoint_output_dir(4)

num_labels(3)

embedding_serialization_factor(3)

from_dict(3)

recompute_checkpoint_every_layer(3)

__init__(2)

layer_norm_eps(2)

output_attentions(2)

attention_probs_dropout_prob(2)

to_dict(2)

update(2)

hidden_dropout_prob(2)

pixel_random_sampling_size(1)

push_to_hub(1)

auto_map(1)

num_masked_blocks(1)

max_length(1)

intermediate_size(1)

CR(1)

from_pertrained(1)

embedding_serialization(1)

dropout_prob(1)

crf_labels(1)

identifier(1)

Métodos Frequentes

from_json_file (30)

from_pretrained (30)

BertConfig (28)

output_hidden_states (18)

vocab_size (13)

num_hidden_layers (9)

max_position_embeddings (7)

get_config_dict (6)

is_decoder (5)

hidden_size (5)

Métodos Frequentes

num_attention_heads (4)

save_pretrained (4)

add_cross_attention (4)

checkpoint_output_dir (4)

num_labels (3)

embedding_serialization_factor (3)

from_dict (3)

recompute_checkpoint_every_layer (3)

__init__ (2)

layer_norm_eps (2)

output_attentions (2)

attention_probs_dropout_prob (2)

to_dict (2)

update (2)

hidden_dropout_prob (2)

pixel_random_sampling_size (1)

push_to_hub (1)

auto_map (1)

num_masked_blocks (1)

max_length (1)

Métodos Frequentes

output_attentions (2)

attention_probs_dropout_prob (2)

to_dict (2)

update (2)

hidden_dropout_prob (2)

pixel_random_sampling_size (1)

push_to_hub (1)

auto_map (1)

num_masked_blocks (1)

max_length (1)

intermediate_size (1)

CR (1)

from_pertrained (1)

embedding_serialization (1)

dropout_prob (1)

crf_labels (1)

identifier (1)

Métodos Frequentes

intermediate_size (1)

CR (1)

from_pertrained (1)

embedding_serialization (1)

dropout_prob (1)

crf_labels (1)

identifier (1)

Exemplo n.º 1

0

Exibir arquivo

def train_model(config_path: str): writer = SummaryWriter() config = read_training_pipeline_params(config_path) logger.info("pretrained_emb {b}", b=config.net_params.pretrained_emb) device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') logger.info("Device is {device}", device=device) SRC, TRG, dataset = get_dataset(config.dataset_path, False) train_data, valid_data, test_data = split_data( dataset, **config.split_ration.__dict__) SRC.build_vocab(train_data, min_freq=3) TRG.build_vocab(train_data, min_freq=3) torch.save(SRC.vocab, config.src_vocab_name) torch.save(TRG.vocab, config.trg_vocab_name) logger.info("Vocab saved") print(f"Unique tokens in source (ru) vocabulary: {len(SRC.vocab)}") print(f"Unique tokens in target (en) vocabulary: {len(TRG.vocab)}") train_iterator, valid_iterator, test_iterator = BucketIterator.splits( (train_data, valid_data, test_data), batch_size=config.BATCH_SIZE, device=device, sort_key=_len_sort_key, ) INPUT_DIM = len(SRC.vocab) OUTPUT_DIM = len(TRG.vocab) config_encoder = BertConfig(vocab_size=INPUT_DIM) config_decoder = BertConfig(vocab_size=OUTPUT_DIM) config = EncoderDecoderConfig.from_encoder_decoder_configs( config_encoder, config_decoder) model = EncoderDecoderModel(config=config) config_encoder = model.config.encoder config_decoder = model.config.decoder config_decoder.is_decoder = True config_decoder.add_cross_attention = True config = EncoderDecoderConfig.from_encoder_decoder_configs( config_encoder, config_decoder) model = EncoderDecoderModel(config=config) args = TrainingArguments( output_dir="output", evaluation_strategy="steps", eval_steps=500, per_device_train_batch_size=128, per_device_eval_batch_size=128, num_train_epochs=10, save_steps=3000, seed=0, load_best_model_at_end=True, ) # args.place_model_on_device = device trainer = Trainer( model=model, args=args, train_dataset=train_iterator, eval_dataset=valid_iterator, callbacks=[EarlyStoppingCallback(early_stopping_patience=3)], ) trainer.train() model.save_pretrained("bert2bert")

Exemplo n.º 2

0

Exibir arquivo

def get_model(vocab_size=30000): config_encoder = BertConfig() config_decoder = BertConfig() config_encoder.vocab_size = vocab_size config_decoder.vocab_size = vocab_size config_decoder.is_decoder = True config_decoder.add_cross_attention = True config = EncoderDecoderConfig.from_encoder_decoder_configs( config_encoder, config_decoder) model = EncoderDecoderModel(config=config) return model

Exemplo n.º 3

0

Exibir arquivo

Arquivo: trans_train.py Projeto: zoey-wangzw/Medical-Dialogue-System

def __init__(self): super().__init__() encoder_config = BertConfig(num_hidden_layers=6, vocab_size=21128, hidden_size=512, num_attention_heads=8) self.encoder = BertModel(encoder_config) decoder_config = BertConfig(num_hidden_layers=6, vocab_size=21128, hidden_size=512, num_attention_heads=8) decoder_config.is_decoder = True self.decoder = BertModel(decoder_config) self.linear = nn.Linear(512, 21128, bias=False)

Exemplo n.º 4

0

Exibir arquivo

def __init__(self): super().__init__() encoder_config = BertConfig(num_hidden_layers=6, vocab_size=30522, hidden_size=512, num_attention_heads=8) self.encoder = BertModel(encoder_config) decoder_config = BertConfig(num_hidden_layers=6, vocab_size=30522, hidden_size=512, num_attention_heads=8) decoder_config.is_decoder = True decoder_config.add_cross_attention = True self.decoder = BertModel(decoder_config) self.linear = nn.Linear( 512, 30522, bias=False) # 21128 for chinese 30522 for English

Exemplo n.º 5

0

Exibir arquivo

Arquivo: visual_linguistic_bert_decoder.py Projeto: phaedonmit/VL-BERT

def __init__(self, config, language_pretrained_model_path=None): super(VisualLinguisticBertDecoder, self).__init__(config) self.config = config # embeddings self.word_embeddings = nn.Embedding(config.vocab_size, config.hidden_size) self.end_embedding = nn.Embedding(1, config.hidden_size) self.position_embeddings = nn.Embedding(config.max_position_embeddings, config.hidden_size) self.token_type_embeddings = nn.Embedding(config.type_vocab_size, config.hidden_size) self.embedding_LayerNorm = BertLayerNorm(config.hidden_size, eps=1e-12) self.embedding_dropout = nn.Dropout(config.hidden_dropout_prob) # for compatibility of roberta self.position_padding_idx = config.position_padding_idx # visual transform self.visual_1x1_text = None self.visual_1x1_object = None if config.visual_size != config.hidden_size: self.visual_1x1_text = nn.Linear(config.visual_size, config.hidden_size) self.visual_1x1_object = nn.Linear(config.visual_size, config.hidden_size) if config.visual_ln: self.visual_ln_text = BertLayerNorm(config.hidden_size, eps=1e-12) self.visual_ln_object = BertLayerNorm(config.hidden_size, eps=1e-12) else: visual_scale_text = nn.Parameter(torch.as_tensor( self.config.visual_scale_text_init, dtype=torch.float), requires_grad=True) self.register_parameter('visual_scale_text', visual_scale_text) visual_scale_object = nn.Parameter(torch.as_tensor( self.config.visual_scale_object_init, dtype=torch.float), requires_grad=True) self.register_parameter('visual_scale_object', visual_scale_object) # ********************************************* # FM addition - Set-up decoder layer for MT # Initializing a BERT bert-base-uncased style configuration configuration = BertConfig() configuration.vocab_size = config.vocab_size # FM edit: reduce size - 12 layers doesn't fit in single 12GB GPU configuration.num_hidden_layers = 6 configuration.is_decoder = True # Initializing a model from the bert-base-uncased style configuration self.decoder = BertModel(configuration) # ********************************************* if self.config.with_pooler: self.pooler = BertPooler(config) # init weights self.apply(self.init_weights) if config.visual_ln: self.visual_ln_text.weight.data.fill_( self.config.visual_scale_text_init) self.visual_ln_object.weight.data.fill_( self.config.visual_scale_object_init) # load language pretrained model if language_pretrained_model_path is not None: self.load_language_pretrained_model(language_pretrained_model_path) if config.word_embedding_frozen: for p in self.word_embeddings.parameters(): p.requires_grad = False self.special_word_embeddings = nn.Embedding( NUM_SPECIAL_WORDS, config.hidden_size) self.special_word_embeddings.weight.data.copy_( self.word_embeddings.weight.data[:NUM_SPECIAL_WORDS])