Python JacDataParallel.parameters Exemples

Langage de programmation: Python

Espace de nommage/Pack: jactorch.parallel

Class/Type: JacDataParallel

Méthode/Fonction: parameters

Exemples au hotexamples.com: 2

Python JacDataParallel.parameters - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de jactorch.parallel.JacDataParallel.parameters extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

JacDataParallel(8)

eval(6)

train(3)

parameters(2)

named_parameters(1)

Méthodes fréquemment utilisées

JacDataParallel (8)

eval (6)

train (3)

parameters (2)

named_parameters (1)

Exemple #1

0

Afficher le fichier

def main(): # directories if not args.debug: args.dump_dir = ensure_path(osp.join('dumps', args.series_name, args.desc_name, args.run_name)) args.ckpt_dir = ensure_path(osp.join(args.dump_dir, 'checkpoints')) args.vis_dir = ensure_path(osp.join(args.dump_dir, 'visualizations')) args.meta_file = osp.join(args.dump_dir, 'metainfo.json') args.log_file = osp.join(args.dump_dir, 'log.log') args.meter_file = osp.join(args.dump_dir, 'meter.json') # Initialize the tensorboard. if args.use_tb: args.tb_dir = ensure_path(osp.join(args.dump_dir, 'tensorboard')) else: args.tb_dir = None if not args.debug: logger.critical('Writing logs to file: "{}".'.format(args.log_file)) set_output_file(args.log_file) logger.critical('Writing metainfo to file: "{}".'.format(args.meta_file)) with open(args.meta_file, 'w') as f: f.write(dump_metainfo(args=args.__dict__, configs=configs)) if args.debug and args.use_tb: logger.warning('Disabling the tensorboard in the debug mode.') args.use_tb = False if args.evaluate and args.use_tb: logger.warning('Disabling the tensorboard in the evaluation mode.') args.use_tb = False # TODO(Jiayuan Mao @ 04/23): load the dataset. logger.critical('Loading the dataset.') train_dataset = None validation_dataset = None # configs.validate_dataset_compatibility(train_dataset) # TODO(Jiayuan Mao @ 04/23): build the model. logger.critical('Building the model.') model = desc.make_model(args) if args.use_gpu: model.cuda() # Use the customized data parallel if applicable. if args.gpu_parallel: from jactorch.parallel import JacDataParallel # Set user_scattered because we will add a multi GPU wrapper to the dataloader. See below. model = JacDataParallel(model, device_ids=args.gpus, user_scattered=True).cuda() # TODO(Jiayuan Mao @ 04/23): disable the cudnn benchmark. # Disable the cudnn benchmark. cudnn.benchmark = False if hasattr(desc, 'make_optimizer'): logger.critical('Building customized optimizer.') optimizer = desc.make_optimizer(model, args.lr) else: from jactorch.optim import AdamW # TODO(Jiayuan Mao @ 04/23): set the default optimizer. trainable_parameters = filter(lambda x: x.requires_grad, model.parameters()) optimizer = AdamW(trainable_parameters, args.lr, weight_decay=configs.train.weight_decay) if args.acc_grad > 1: from jactorch.optim import AccumGrad optimizer = AccumGrad(optimizer, args.acc_grad) logger.warning('Use accumulated grad={:d}, effective iterations per epoch={:d}.'.format(args.acc_grad, int(args.iters_per_epoch / args.acc_grad))) trainer = TrainerEnv(model, optimizer) if args.resume: extra = trainer.load_checkpoint(args.resume) if extra: args.start_epoch = extra['epoch'] logger.critical('Resume from epoch {}.'.format(args.start_epoch)) elif args.load: if trainer.load_weights(args.load): logger.critical('Loaded weights from pretrained model: "{}".'.format(args.load)) if args.use_tb: from jactorch.train.tb import TBLogger, TBGroupMeters tb_logger = TBLogger(args.tb_dir) meters = TBGroupMeters(tb_logger) logger.critical('Writing tensorboard logs to: "{}".'.format(args.tb_dir)) else: from jacinle.utils.meter import GroupMeters meters = GroupMeters() if not args.debug: logger.critical('Writing metainfo to file: "{}".'.format(args.meta_file)) with open(args.meta_file, 'w') as f: f.write(dump_metainfo(args=args.__dict__, configs=configs)) logger.critical('Writing meter logs to file: "{}".'.format(args.meter_file)) logger.critical('Initializing MLDash.') mldash.init( desc_name=args.series_name + '/' + args.desc_name, expr_name=args.expr, run_name=args.run_name, args=args, highlight_args=parser, configs=configs, ) mldash.update(metainfo_file=args.meta_file, log_file=args.log_file, meter_file=args.meter_file, tb_dir=args.tb_dir) if args.embed: from IPython import embed; embed() if hasattr(desc, 'customize_trainer'): desc.customize_trainer(trainer) # TODO(Jiayuan Mao @ 04/23): make the data loader. logger.critical('Building the data loader.') train_dataloader = train_dataset.make_dataloader(args.batch_size, shuffle=True, drop_last=True, nr_workers=args.data_workers) validation_dataloader = validation_dataset.make_dataloader(args.batch_size, shuffle=False, drop_last=False, nr_workers=args.data_workers) if args.use_gpu and args.gpu_parallel: from jactorch.data.dataloader import JacDataLoaderMultiGPUWrapper train_dataloader = JacDataLoaderMultiGPUWrapper(train_dataloader, args.gpus) validation_dataloader = JacDataLoaderMultiGPUWrapper(validation_dataloader, args.gpus) if args.evaluate: epoch = 0 model.eval() validate_epoch(epoch, trainer, validation_dataloader, meters) if not args.debug: meters.dump(args.meter_file) logger.critical(meters.format_simple('Epoch = {}'.format(epoch), compressed=False)) return for epoch in range(args.start_epoch + 1, args.epochs + 1): meters.reset() model.train() train_epoch(epoch, trainer, train_dataloader, meters) if args.validation_interval > 0 and epoch % args.validation_interval == 0: model.eval() with torch.no_grad(): validate_epoch(epoch, trainer, validation_dataloader, meters) if not args.debug: meters.dump(args.meter_file) # TODO(Jiayuan Mao @ 02/15): config the MLDash. if not args.debug: mldash.log_metric('epoch', epoch, desc=False, expr=False) for key, value in meters.items(): if key.startswith('loss') or key.startswith('validation/loss'): mldash.log_metric_min(key, value.avg) for key, value in meters.items(): if key.startswith('acc') or key.startswith('validation/acc'): mldash.log_metric_max(key, value.avg) logger.critical(meters.format_simple('Epoch = {}'.format(epoch), compressed=False)) if not args.debug: if epoch % args.save_interval == 0: fname = osp.join(args.ckpt_dir, 'epoch_{}.pth'.format(epoch)) trainer.save_checkpoint(fname, dict(epoch=epoch, meta_file=args.meta_file))

Exemple #2

0

Afficher le fichier

Fichier : trainval.py Projet : bergen/NSCL-PyTorch-Release

def main_train(train_dataset, validation_dataset, extra_dataset=None): logger.critical('Building the model.') model = desc.make_model(args, train_dataset.unwrapped.vocab) if args.use_gpu: model.cuda() # Use the customized data parallel if applicable. if args.gpu_parallel: from jactorch.parallel import JacDataParallel # from jactorch.parallel import UserScatteredJacDataParallel as JacDataParallel model = JacDataParallel(model, device_ids=args.gpus).cuda() # Disable the cudnn benchmark. cudnn.benchmark = False if hasattr(desc, 'make_optimizer'): logger.critical('Building customized optimizer.') optimizer = desc.make_optimizer(model, args.lr) else: from jactorch.optim import AdamW trainable_parameters = filter(lambda x: x.requires_grad, model.parameters()) optimizer = AdamW(trainable_parameters, args.lr, weight_decay=configs.train.weight_decay) if args.acc_grad > 1: from jactorch.optim import AccumGrad optimizer = AccumGrad(optimizer, args.acc_grad) logger.warning( 'Use accumulated grad={:d}, effective iterations per epoch={:d}.'. format(args.acc_grad, int(args.iters_per_epoch / args.acc_grad))) trainer = TrainerEnv(model, optimizer) if args.resume: extra = trainer.load_checkpoint(args.resume) if extra: args.start_epoch = extra['epoch'] logger.critical('Resume from epoch {}.'.format(args.start_epoch)) elif args.load: if trainer.load_weights(args.load): logger.critical( 'Loaded weights from pretrained model: "{}".'.format( args.load)) if args.use_tb and not args.debug: from jactorch.train.tb import TBLogger, TBGroupMeters tb_logger = TBLogger(args.tb_dir) meters = TBGroupMeters(tb_logger) logger.critical('Writing tensorboard logs to: "{}".'.format( args.tb_dir)) else: from jacinle.utils.meter import GroupMeters meters = GroupMeters() if not args.debug: logger.critical('Writing meter logs to file: "{}".'.format( args.meter_file)) if args.clip_grad: logger.info('Registering the clip_grad hook: {}.'.format( args.clip_grad)) def clip_grad(self, loss): from torch.nn.utils import clip_grad_norm_ clip_grad_norm_(self.model.parameters(), max_norm=args.clip_grad) trainer.register_event('backward:after', clip_grad) if hasattr(desc, 'customize_trainer'): desc.customize_trainer(trainer) if args.embed: from IPython import embed embed() # assert args.curriculum == 'off', 'Unimplemented feature: curriculum mode {}.'.format(args.curriculum) if args.curriculum == 'restricted': curriculum_strategy = [(0, 3, 4), (10, 3, 6), (1e9, None, None)] validation_restriction = (3, 6) else: curriculum_strategy = [(0, 3, 4), (5, 3, 6), (10, 3, 8), (15, 4, 8), (25, 4, 12), (35, 5, 12), (45, 6, 12), (55, 7, 16), (65, 8, 20), (75, 9, 22), (90, 10, 25), (1e9, None, None)] # trainer.register_event('backward:after', backward_check_nan) if args.curriculum == 'restricted': max_validation_scene_size, max_validation_program_size = validation_restriction validation_dataset = validation_dataset.filter_scene_size( max_validation_scene_size) validation_dataset = validation_dataset.filter_program_size_raw( max_validation_program_size) logger.critical('Building the data loader.') validation_dataloader = validation_dataset.make_dataloader( args.batch_size, shuffle=False, drop_last=False, nr_workers=args.data_workers) if extra_dataset is not None: extra_dataloader = extra_dataset.make_dataloader( args.batch_size, shuffle=False, drop_last=False, nr_workers=args.data_workers) if args.evaluate: meters.reset() model.eval() validate_epoch(0, trainer, validation_dataloader, meters) if extra_dataset is not None: validate_epoch(0, trainer, extra_dataloader, meters, meter_prefix='validation_extra') logger.critical( meters.format_simple( 'Validation', {k: v for k, v in meters.avg.items() if v != 0}, compressed=False)) return meters for epoch in range(args.start_epoch + 1, args.epochs + 1): meters.reset() model.train() this_train_dataset = train_dataset if args.curriculum != 'off': for si, s in enumerate(curriculum_strategy): if curriculum_strategy[si][0] < epoch <= curriculum_strategy[ si + 1][0]: max_scene_size, max_program_size = s[1:] if args.curriculum in ('scene', 'all', 'restricted'): this_train_dataset = this_train_dataset.filter_scene_size( max_scene_size) if args.curriculum in ('program', 'all', 'restricted'): this_train_dataset = this_train_dataset.filter_program_size_raw( max_program_size) logger.critical( 'Building the data loader. Curriculum = {}/{}, length = {}.' .format(*s[1:], len(this_train_dataset))) break train_dataloader = this_train_dataset.make_dataloader( args.batch_size, shuffle=True, drop_last=True, nr_workers=args.data_workers) for enum_id in range(args.enums_per_epoch): train_epoch(epoch, trainer, train_dataloader, meters) if epoch % args.validation_interval == 0: model.eval() validate_epoch(epoch, trainer, validation_dataloader, meters) if not args.debug: meters.dump(args.meter_file) logger.critical( meters.format_simple('Epoch = {}'.format(epoch), { k: v for k, v in meters.avg.items() if epoch % args.validation_interval == 0 or not k.startswith('validation') }, compressed=False)) if epoch % args.save_interval == 0 and not args.debug: fname = osp.join(args.ckpt_dir, 'epoch_{}.pth'.format(epoch)) trainer.save_checkpoint( fname, dict(epoch=epoch, meta_file=args.meta_file)) if epoch > int(args.epochs * 0.6): trainer.set_learning_rate(args.lr * 0.1)