Python BertConfig.add_cross_attention Exemples

Langage de programmation: Python

Espace de nommage/Pack: transformers

Class/Type: BertConfig

Méthode/Fonction: add_cross_attention

Exemples au hotexamples.com: 4

Python BertConfig.add_cross_attention - 4 exemples trouvés. Ce sont les exemples réels les mieux notés de transformers.BertConfig.add_cross_attention extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

from_json_file(30)

from_pretrained(30)

BertConfig(28)

output_hidden_states(18)

vocab_size(13)

num_hidden_layers(9)

max_position_embeddings(7)

get_config_dict(6)

is_decoder(5)

hidden_size(5)

num_attention_heads(4)

save_pretrained(4)

add_cross_attention(4)

checkpoint_output_dir(4)

num_labels(3)

embedding_serialization_factor(3)

from_dict(3)

recompute_checkpoint_every_layer(3)

__init__(2)

layer_norm_eps(2)

output_attentions(2)

attention_probs_dropout_prob(2)

to_dict(2)

update(2)

hidden_dropout_prob(2)

pixel_random_sampling_size(1)

push_to_hub(1)

auto_map(1)

num_masked_blocks(1)

max_length(1)

intermediate_size(1)

CR(1)

from_pertrained(1)

embedding_serialization(1)

dropout_prob(1)

crf_labels(1)

identifier(1)

Méthodes fréquemment utilisées

from_json_file (30)

from_pretrained (30)

BertConfig (28)

output_hidden_states (18)

vocab_size (13)

num_hidden_layers (9)

max_position_embeddings (7)

get_config_dict (6)

is_decoder (5)

hidden_size (5)

Méthodes fréquemment utilisées

num_attention_heads (4)

save_pretrained (4)

add_cross_attention (4)

checkpoint_output_dir (4)

num_labels (3)

embedding_serialization_factor (3)

from_dict (3)

recompute_checkpoint_every_layer (3)

__init__ (2)

layer_norm_eps (2)

output_attentions (2)

attention_probs_dropout_prob (2)

to_dict (2)

update (2)

hidden_dropout_prob (2)

pixel_random_sampling_size (1)

push_to_hub (1)

auto_map (1)

num_masked_blocks (1)

max_length (1)

Méthodes fréquemment utilisées

output_attentions (2)

attention_probs_dropout_prob (2)

to_dict (2)

update (2)

hidden_dropout_prob (2)

pixel_random_sampling_size (1)

push_to_hub (1)

auto_map (1)

num_masked_blocks (1)

max_length (1)

intermediate_size (1)

CR (1)

from_pertrained (1)

embedding_serialization (1)

dropout_prob (1)

crf_labels (1)

identifier (1)

Méthodes fréquemment utilisées

intermediate_size (1)

CR (1)

from_pertrained (1)

embedding_serialization (1)

dropout_prob (1)

crf_labels (1)

identifier (1)

Exemple #1

0

Afficher le fichier

Fichier : __init__.py Projet : biggoron/phonetizer

def __init__(self, device='cpu', model=None): vocabsize = 37 max_length = 50 encoder_config = BertConfig(vocab_size=vocabsize, max_position_embeddings=max_length + 64, num_attention_heads=4, num_hidden_layers=4, hidden_size=128, type_vocab_size=1) encoder = BertModel(config=encoder_config) vocabsize = 33 max_length = 50 decoder_config = BertConfig(vocab_size=vocabsize, max_position_embeddings=max_length + 64, num_attention_heads=4, num_hidden_layers=4, hidden_size=128, type_vocab_size=1, add_cross_attentions=True, is_decoder=True) decoder_config.add_cross_attention = True decoder = BertLMHeadModel(config=decoder_config) # Define encoder decoder model self.model = EncoderDecoderModel(encoder=encoder, decoder=decoder) self.model.to(device) self.device = device if model is not None: self.model.load_state_dict(torch.load(model))

Exemple #2

0

Afficher le fichier

def train_model(config_path: str): writer = SummaryWriter() config = read_training_pipeline_params(config_path) logger.info("pretrained_emb {b}", b=config.net_params.pretrained_emb) device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') logger.info("Device is {device}", device=device) SRC, TRG, dataset = get_dataset(config.dataset_path, False) train_data, valid_data, test_data = split_data( dataset, **config.split_ration.__dict__) SRC.build_vocab(train_data, min_freq=3) TRG.build_vocab(train_data, min_freq=3) torch.save(SRC.vocab, config.src_vocab_name) torch.save(TRG.vocab, config.trg_vocab_name) logger.info("Vocab saved") print(f"Unique tokens in source (ru) vocabulary: {len(SRC.vocab)}") print(f"Unique tokens in target (en) vocabulary: {len(TRG.vocab)}") train_iterator, valid_iterator, test_iterator = BucketIterator.splits( (train_data, valid_data, test_data), batch_size=config.BATCH_SIZE, device=device, sort_key=_len_sort_key, ) INPUT_DIM = len(SRC.vocab) OUTPUT_DIM = len(TRG.vocab) config_encoder = BertConfig(vocab_size=INPUT_DIM) config_decoder = BertConfig(vocab_size=OUTPUT_DIM) config = EncoderDecoderConfig.from_encoder_decoder_configs( config_encoder, config_decoder) model = EncoderDecoderModel(config=config) config_encoder = model.config.encoder config_decoder = model.config.decoder config_decoder.is_decoder = True config_decoder.add_cross_attention = True config = EncoderDecoderConfig.from_encoder_decoder_configs( config_encoder, config_decoder) model = EncoderDecoderModel(config=config) args = TrainingArguments( output_dir="output", evaluation_strategy="steps", eval_steps=500, per_device_train_batch_size=128, per_device_eval_batch_size=128, num_train_epochs=10, save_steps=3000, seed=0, load_best_model_at_end=True, ) # args.place_model_on_device = device trainer = Trainer( model=model, args=args, train_dataset=train_iterator, eval_dataset=valid_iterator, callbacks=[EarlyStoppingCallback(early_stopping_patience=3)], ) trainer.train() model.save_pretrained("bert2bert")

Exemple #3

0

Afficher le fichier

def get_model(vocab_size=30000): config_encoder = BertConfig() config_decoder = BertConfig() config_encoder.vocab_size = vocab_size config_decoder.vocab_size = vocab_size config_decoder.is_decoder = True config_decoder.add_cross_attention = True config = EncoderDecoderConfig.from_encoder_decoder_configs( config_encoder, config_decoder) model = EncoderDecoderModel(config=config) return model

Exemple #4

0

Afficher le fichier

def __init__(self): super().__init__() encoder_config = BertConfig(num_hidden_layers=6, vocab_size=30522, hidden_size=512, num_attention_heads=8) self.encoder = BertModel(encoder_config) decoder_config = BertConfig(num_hidden_layers=6, vocab_size=30522, hidden_size=512, num_attention_heads=8) decoder_config.is_decoder = True decoder_config.add_cross_attention = True self.decoder = BertModel(decoder_config) self.linear = nn.Linear( 512, 30522, bias=False) # 21128 for chinese 30522 for English