Python TrainingArguments.per_device_train_batch_size示例

编程语言: Python

命名空间/包名称: transformers

方法/功能: per_device_train_batch_size

hotexamples.com的示例: 3

Python TrainingArguments.per_device_train_batch_size - 已找到3个示例。这些是从开源项目中提取的最受好评的transformers.TrainingArguments.per_device_train_batch_size现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

TrainingArguments(30)

to_dict(6)

output_dir(6)

save_steps(5)

num_train_epochs(4)

do_train(4)

logging_steps(4)

logging_dir(3)

learning_rate(3)

per_device_train_batch_size(3)

per_gpu_eval_batch_size(2)

evaluation_strategy(2)

eval_steps(2)

no_cuda(2)

seed(2)

per_device_eval_batch_size(2)

remove_unused_columns(2)

run_name(1)

pororo_prediction(1)

save_total_limit(1)

per_gpu_train_batch_size(1)

task_name(1)

metric_for_best_model(1)

_n_gpu(1)

load_best_model_at_end(1)

greater_is_better(1)

fp16_opt_level(1)

fp16(1)

evaluate_during_training(1)

do_eval(1)

dataloader_drop_last(1)

adam_epsilon(1)

warmup_steps(1)

示例#1

显示文件

 def init_training_args(self, model_path: str) -> TrainingArguments:
     r"""
     构造训练参数.
 """
     training_args = TrainingArguments(output_dir=model_path)
     training_args.logging_steps = 5000
     training_args.save_steps = 5000
     training_args.learning_rate = 2e-5
     training_args.num_train_epochs = 3
     training_args.per_device_train_batch_size = 32
     training_args.fp16 = self.fp16
     training_args.fp16_opt_level = "O1"
     return training_args

示例#2

显示文件

文件： run_sentence_classification.py 项目： frankaging/limits-cross-domain-transfer

def generate_training_args(args, inoculation_step):
    training_args = TrainingArguments("tmp_trainer")
    training_args.no_cuda = args.no_cuda
    training_args.seed = args.seed
    training_args.do_train = args.do_train
    training_args.do_eval = args.do_eval
    training_args.output_dir = os.path.join(args.output_dir, str(inoculation_step)+"-sample")
    training_args.evaluation_strategy = args.evaluation_strategy # evaluation is done after each epoch
    training_args.metric_for_best_model = args.metric_for_best_model
    training_args.greater_is_better = args.greater_is_better
    training_args.logging_dir = args.logging_dir
    training_args.task_name = args.task_name
    training_args.learning_rate = args.learning_rate
    training_args.per_device_train_batch_size = args.per_device_train_batch_size
    training_args.per_device_eval_batch_size = args.per_device_eval_batch_size
    training_args.num_train_epochs = args.num_train_epochs # this is the maximum num_train_epochs, we set this to be 100.
    training_args.eval_steps = args.eval_steps
    training_args.logging_steps = args.logging_steps
    training_args.load_best_model_at_end = args.load_best_model_at_end
    if args.save_total_limit != -1:
        # only set if it is specified
        training_args.save_total_limit = args.save_total_limit
    import datetime
    date_time = "{}-{}".format(datetime.datetime.now().month, datetime.datetime.now().day)
    run_name = "{0}_{1}_{2}_{3}_mlen_{4}_lr_{5}_seed_{6}_metrics_{7}".format(
        args.run_name,
        args.task_name,
        args.model_type,
        date_time,
        args.max_seq_length,
        args.learning_rate,
        args.seed,
        args.metric_for_best_model
    )
    training_args.run_name = run_name
    training_args_dict = training_args.to_dict()
    # for PR
    _n_gpu = training_args_dict["_n_gpu"]
    del training_args_dict["_n_gpu"]
    training_args_dict["n_gpu"] = _n_gpu
    HfParser = HfArgumentParser((TrainingArguments))
    training_args = HfParser.parse_dict(training_args_dict)[0]

    if args.model_path == "":
        args.model_path = args.model_type
        if args.model_type == "":
            assert False # you have to provide one of them.
    # Set seed before initializing model.
    set_seed(training_args.seed)

    # Setup logging
    logging.basicConfig(
        format="%(asctime)s - %(levelname)s - %(name)s - %(message)s",
        datefmt="%m/%d/%Y %H:%M:%S",
        level=logging.INFO if is_main_process(training_args.local_rank) else logging.WARN,
    )

    # Log on each process the small summary:
    logger.warning(
        f"Process rank: {training_args.local_rank}, device: {training_args.device}, n_gpu: {training_args.n_gpu}"
        + f"distributed training: {bool(training_args.local_rank != -1)}, 16-bits training: {training_args.fp16}"
    )

    # Set the verbosity to info of the Transformers logger (on main process only):
    if is_main_process(training_args.local_rank):
        transformers.utils.logging.set_verbosity_info()
        transformers.utils.logging.enable_default_handler()
        transformers.utils.logging.enable_explicit_format()
    logger.info(f"Training/evaluation parameters {training_args}")
    return training_args

示例#3

显示文件

文件： GPT2_Finetuning.py 项目： renhaocui/TweetParaphrase

        result = {"perplexity": perplexity}

        output_eval_file = os.path.join(training_args.output_dir, "eval_results_lm.txt")
        if trainer.is_world_master():
            with open(output_eval_file, "w") as writer:
                for key in sorted(result.keys()):
                    writer.write("%s = %s\n" % (key, str(result[key])))

        results.update(result)

    return results


if __name__ == "__main__":
    outputDir = 'data/output/temp'
    trainFile = 'data/pmt.sample.lm'

    modelArgs = ModelArguments()
    modelArgs.model_name_or_path = 'gpt2'
    modelArgs.model_type = 'gpt2'
    dataArgs = DataTrainingArguments()
    dataArgs.train_data_file = trainFile
    dataArgs.line_by_line = True
    trainArgs = TrainingArguments(output_dir=outputDir)
    trainArgs.do_train = True
    trainArgs.per_device_train_batch_size = 1
    trainArgs.save_total_limit = 5
    trainArgs.num_train_epochs = 1
    process(modelArgs, dataArgs, trainArgs)