Python BertConfig.layer_norm_eps Exemples

Langage de programmation: Python

Espace de nommage/Pack: transformers

Class/Type: BertConfig

Méthode/Fonction: layer_norm_eps

Exemples au hotexamples.com: 2

Python BertConfig.layer_norm_eps - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de transformers.BertConfig.layer_norm_eps extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

from_json_file(30)

from_pretrained(30)

BertConfig(28)

output_hidden_states(18)

vocab_size(13)

num_hidden_layers(9)

max_position_embeddings(7)

get_config_dict(6)

is_decoder(5)

hidden_size(5)

num_attention_heads(4)

save_pretrained(4)

add_cross_attention(4)

checkpoint_output_dir(4)

num_labels(3)

embedding_serialization_factor(3)

from_dict(3)

recompute_checkpoint_every_layer(3)

__init__(2)

layer_norm_eps(2)

output_attentions(2)

attention_probs_dropout_prob(2)

to_dict(2)

update(2)

hidden_dropout_prob(2)

pixel_random_sampling_size(1)

push_to_hub(1)

auto_map(1)

num_masked_blocks(1)

max_length(1)

intermediate_size(1)

CR(1)

from_pertrained(1)

embedding_serialization(1)

dropout_prob(1)

crf_labels(1)

identifier(1)

Méthodes fréquemment utilisées

from_json_file (30)

from_pretrained (30)

BertConfig (28)

output_hidden_states (18)

vocab_size (13)

num_hidden_layers (9)

max_position_embeddings (7)

get_config_dict (6)

is_decoder (5)

hidden_size (5)

Méthodes fréquemment utilisées

num_attention_heads (4)

save_pretrained (4)

add_cross_attention (4)

checkpoint_output_dir (4)

num_labels (3)

embedding_serialization_factor (3)

from_dict (3)

recompute_checkpoint_every_layer (3)

__init__ (2)

layer_norm_eps (2)

output_attentions (2)

attention_probs_dropout_prob (2)

to_dict (2)

update (2)

hidden_dropout_prob (2)

pixel_random_sampling_size (1)

push_to_hub (1)

auto_map (1)

num_masked_blocks (1)

max_length (1)

Méthodes fréquemment utilisées

output_attentions (2)

attention_probs_dropout_prob (2)

to_dict (2)

update (2)

hidden_dropout_prob (2)

pixel_random_sampling_size (1)

push_to_hub (1)

auto_map (1)

num_masked_blocks (1)

max_length (1)

intermediate_size (1)

CR (1)

from_pertrained (1)

embedding_serialization (1)

dropout_prob (1)

crf_labels (1)

identifier (1)

Méthodes fréquemment utilisées

intermediate_size (1)

CR (1)

from_pertrained (1)

embedding_serialization (1)

dropout_prob (1)

crf_labels (1)

identifier (1)

Exemple #1

0

Afficher le fichier

Fichier : EBertUtils.py Projet : p-karisani/self_pretraining

def __get_internal_bert_config(model_path, gradient_checkpointing): label_count = 2 dropout_prob = EVar.Dropout task_name = 'cola' b_config = BertConfig(num_labels=label_count, hidden_dropout_prob=dropout_prob, finetuning_task=task_name, output_hidden_states=False, output_attentions=False, gradient_checkpointing=gradient_checkpointing) b_config.layer_norm_eps = 1e-12 return b_config

Exemple #2

0

Afficher le fichier

Fichier : nsp_sop_experiment.py Projet : osuossu8/Utils

val_features = [ torch.tensor(np.array([i for i in nsp_df['input_ids'].values])[val_idx].astype("int32"), dtype=torch.long), torch.tensor(np.array([i for i in nsp_df['input_mask'].values])[val_idx].astype("int32"), dtype=torch.long) ] y_train_torch = torch.tensor(y_train, dtype=torch.float32) y_val_torch = torch.tensor(y_val, dtype=torch.float32) train_dataset = TensorDataset(*features, y_train_torch) val_dataset = TensorDataset(*val_features, y_val_torch) train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True, num_workers=0, pin_memory=True, drop_last=True) val_loader = DataLoader(val_dataset, batch_size=batch_size, shuffle=True, num_workers=0, pin_memory=True, drop_last=True) BERT_MODEL_PATH = '/content/drive/My Drive/PyTorch版/' bert_config = BertConfig(BERT_MODEL_PATH+'bert_config.json') bert_config.layer_norm_eps=1e-12 bert_config.num_hidden_layers = 6 model = BertForNextSentencePrediction(bert_config) model.to(device) lr = 1e-5 criterion = torch.nn.BCEWithLogitsLoss().cuda() optimizer = torch.optim.Adam(model.parameters(), lr=lr) param_lrs = [{'params': param, 'lr': lr} for param in model.parameters()] scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer, lambda epoch: 0.6 ** epoch) from tqdm import tqdm from sklearn.metrics import accuracy_score def train_one_epoch(model, train_loader, criterion, optimizer, device, steps_upd_logging=500, accumulation_steps=1,