Exemplos de Trainer.hpc_load em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: pytorch_lightning

Classe / Tipo: Trainer

Método / Função: hpc_load

Exemplos em hotexamples.com: 7

Trainer.hpc_load em Python - 7 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de pytorch_lightning.Trainer.hpc_load em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

Trainer(30)

from_argparse_args(30)

fit(30)

add_argparse_args(30)

init_optimizers(13)

hpc_save(13)

is_slurm_managing_tasks(9)

checkpoint_callback(8)

get_model(7)

hpc_load(7)

current_epoch(6)

datamodule(6)

_reset_eval_dataloader(5)

_checkpoint_connector(5)

checkpoint_connector(5)

get_dataloaders(4)

accelerator_backend(4)

default_attributes(4)

auto_add_sampler(4)

get_test_dataloaders(4)

callbacks(4)

fit_loop(3)

get_val_dataloaders(3)

_evaluate(3)

callback_metrics(3)

_update_dataloader(3)

_add_sampler_metadata_collate(2)

_restore_modules_and_callbacks(2)

is_overridden(1)

global_step(1)

limit_train_batches(1)

has_arg(1)

is_function_implemented(1)

get_init_arguments_and_types(1)

interrupted(1)

convert_to_lightning_optimizers(1)

evaluate(1)

auto_add_worker_init_fn(1)

_default_root_dir(1)

_device_type(1)

_distrib_type(1)

_is_slurm_managing_tasks(1)

_pre_dispatch(1)

_run_evaluate(1)

_run_stage(1)

available_plugins(1)

enable_auto_hpc_walltime_manager(1)

call_hook(1)

can_prepare_data(1)

check_val_every_n_epoch(1)

Métodos Frequentes

Trainer (30)

from_argparse_args (30)

fit (30)

add_argparse_args (30)

init_optimizers (13)

hpc_save (13)

is_slurm_managing_tasks (9)

checkpoint_callback (8)

get_model (7)

hpc_load (7)

Métodos Frequentes

current_epoch (6)

datamodule (6)

_reset_eval_dataloader (5)

_checkpoint_connector (5)

checkpoint_connector (5)

get_dataloaders (4)

accelerator_backend (4)

default_attributes (4)

auto_add_sampler (4)

get_test_dataloaders (4)

callbacks (4)

fit_loop (3)

get_val_dataloaders (3)

_evaluate (3)

callback_metrics (3)

_update_dataloader (3)

_add_sampler_metadata_collate (2)

_restore_modules_and_callbacks (2)

is_overridden (1)

global_step (1)

Métodos Frequentes

callbacks (4)

fit_loop (3)

get_val_dataloaders (3)

_evaluate (3)

callback_metrics (3)

_update_dataloader (3)

_add_sampler_metadata_collate (2)

_restore_modules_and_callbacks (2)

is_overridden (1)

global_step (1)

limit_train_batches (1)

has_arg (1)

is_function_implemented (1)

get_init_arguments_and_types (1)

interrupted (1)

convert_to_lightning_optimizers (1)

evaluate (1)

auto_add_worker_init_fn (1)

_default_root_dir (1)

_device_type (1)

_distrib_type (1)

_is_slurm_managing_tasks (1)

_pre_dispatch (1)

_run_evaluate (1)

_run_stage (1)

available_plugins (1)

enable_auto_hpc_walltime_manager (1)

call_hook (1)

can_prepare_data (1)

check_val_every_n_epoch (1)

Métodos Frequentes

limit_train_batches (1)

has_arg (1)

is_function_implemented (1)

get_init_arguments_and_types (1)

interrupted (1)

convert_to_lightning_optimizers (1)

evaluate (1)

auto_add_worker_init_fn (1)

_default_root_dir (1)

_device_type (1)

_distrib_type (1)

_is_slurm_managing_tasks (1)

_pre_dispatch (1)

_run_evaluate (1)

_run_stage (1)

available_plugins (1)

enable_auto_hpc_walltime_manager (1)

call_hook (1)

can_prepare_data (1)

check_val_every_n_epoch (1)

ckpt_path (1)

detect_nan_tensors (1)

early_stop_callback (1)

early_stopping_callback (1)

limit_val_batches (1)

Exemplo n.º 1

0

Exibir arquivo

def run_model_test(trainer_options, model, on_gpu: bool = True, version=None, with_hpc: bool = True): reset_seed() save_dir = trainer_options['default_root_dir'] # logger file to get meta logger = get_default_logger(save_dir, version=version) trainer_options.update(logger=logger) if 'checkpoint_callback' not in trainer_options: # logger file to get weights checkpoint = init_checkpoint_callback(logger) trainer_options.update(checkpoint_callback=checkpoint) # fit model trainer = Trainer(**trainer_options) result = trainer.fit(model) # correct result and ok accuracy assert result == 1, 'amp + ddp model failed to complete' # test model loading pretrained_model = load_model_from_checkpoint( logger, trainer.checkpoint_callback.dirpath) # test new model accuracy test_loaders = model.test_dataloader() if not isinstance(test_loaders, list): test_loaders = [test_loaders] [ run_prediction(dataloader, pretrained_model) for dataloader in test_loaders ] if with_hpc: if trainer.use_ddp or trainer.use_ddp2: # on hpc this would work fine... but need to hack it for the purpose of the test trainer.model = pretrained_model trainer.optimizers, trainer.lr_schedulers, trainer.optimizer_frequencies = \ trainer.init_optimizers(pretrained_model) # test HPC loading / saving trainer.hpc_save(save_dir, logger) trainer.hpc_load(save_dir, on_gpu=on_gpu)

Exemplo n.º 2

0

Exibir arquivo

Arquivo: train_default_model.py Projeto: vvitsenets/pytorch-lightning

def run_test_from_config(trainer_options): """Trains the default model with the given config.""" set_random_master_port() reset_seed() ckpt_path = trainer_options['weights_save_path'] trainer_options.update(checkpoint_callback=ModelCheckpoint(ckpt_path)) model = EvalModelTemplate() trainer = Trainer(**trainer_options) result = trainer.fit(model) assert result == 1 # Horovod should be initialized following training. If not, this will raise an exception. assert hvd.size() == 2 if trainer.global_rank > 0: # on higher ranks the checkpoint location is unknown # we want to test checkpointing on rank 0 only assert not hasattr(trainer, 'ckpt_path') assert not trainer.checkpoint_callback.best_model_path return # test model loading pretrained_model = EvalModelTemplate.load_from_checkpoint( trainer.checkpoint_callback.best_model_path) # test new model accuracy test_loaders = model.test_dataloader() if not isinstance(test_loaders, list): test_loaders = [test_loaders] for dataloader in test_loaders: run_prediction(dataloader, pretrained_model) # test HPC loading / saving trainer.hpc_save(ckpt_path, trainer.logger) trainer.hpc_load(ckpt_path, on_gpu=args.on_gpu) if args.on_gpu: trainer = Trainer(gpus=1, distributed_backend='horovod', max_epochs=1) # Test the root_gpu property assert trainer.root_gpu == hvd.local_rank()

Exemplo n.º 3

0

Exibir arquivo

def run_model_test(trainer_options, model, on_gpu=True): save_dir = trainer_options['default_save_path'] # logger file to get meta logger = get_test_tube_logger(save_dir, False) # logger file to get weights checkpoint = init_checkpoint_callback(logger) # add these to the trainer options trainer_options['checkpoint_callback'] = checkpoint trainer_options['logger'] = logger # fit model trainer = Trainer(**trainer_options) result = trainer.fit(model) # correct result and ok accuracy assert result == 1, 'amp + ddp model failed to complete' # test model loading pretrained_model = load_model(logger, trainer.checkpoint_callback.filepath) # test new model accuracy test_loaders = model.test_dataloader() if not isinstance(test_loaders, list): test_loaders = [test_loaders] [ run_prediction(dataloader, pretrained_model) for dataloader in test_loaders ] if trainer.use_ddp or trainer.use_ddp2: # on hpc this would work fine... but need to hack it for the purpose of the test trainer.model = pretrained_model trainer.optimizers, trainer.lr_schedulers = pretrained_model.configure_optimizers( ) # test HPC loading / saving trainer.hpc_save(save_dir, logger) trainer.hpc_load(save_dir, on_gpu=on_gpu)

Exemplo n.º 4

0

Exibir arquivo

Arquivo: test_models.py Projeto: lironghua318/pytorch-lightning

def run_gpu_model_test(trainer_options, model, hparams, on_gpu=True): save_dir = init_save_dir() # logger file to get meta logger = get_test_tube_logger(False) logger.log_hyperparams(hparams) logger.save() # logger file to get weights checkpoint = ModelCheckpoint(save_dir) # add these to the trainer options trainer_options['checkpoint_callback'] = checkpoint trainer_options['logger'] = logger # fit model trainer = Trainer(**trainer_options) result = trainer.fit(model) # correct result and ok accuracy assert result == 1, 'amp + ddp model failed to complete' # test model loading pretrained_model = load_model(logger.experiment, save_dir) # test new model accuracy [ run_prediction(dataloader, pretrained_model) for dataloader in model.test_dataloader() ] if trainer.use_ddp: # on hpc this would work fine... but need to hack it for the purpose of the test trainer.model = pretrained_model trainer.optimizers, trainer.lr_schedulers = pretrained_model.configure_optimizers( ) # test HPC loading / saving trainer.hpc_save(save_dir, logger) trainer.hpc_load(save_dir, on_gpu=on_gpu) clear_save_dir()

Exemplo n.º 5

0

Exibir arquivo

Arquivo: test_models.py Projeto: yibit/pytorch-lightning

def run_gpu_model_test(trainer_options, model, hparams, on_gpu=True): save_dir = init_save_dir() # exp file to get meta exp = get_exp(False) exp.argparse(hparams) exp.save() # exp file to get weights checkpoint = ModelCheckpoint(save_dir) # add these to the trainer options trainer_options['checkpoint_callback'] = checkpoint trainer_options['experiment'] = exp # fit model trainer = Trainer(**trainer_options) result = trainer.fit(model) # correct result and ok accuracy assert result == 1, 'amp + ddp model failed to complete' # test model loading pretrained_model = load_model(exp, save_dir, on_gpu) # test model preds run_prediction(model.test_dataloader, pretrained_model) if trainer.use_ddp: # on hpc this would work fine... but need to hack it for the purpose of the test trainer.model = pretrained_model trainer.optimizers, trainer.lr_schedulers = pretrained_model.configure_optimizers( ) # test HPC loading / saving trainer.hpc_save(save_dir, exp) trainer.hpc_load(save_dir, on_gpu=on_gpu) clear_save_dir()

Exemplo n.º 6

0

Exibir arquivo

def test_amp_gpu_ddp_slurm_managed(): """ Make sure DDP + AMP work :return: """ if not can_run_gpu_test(): return # simulate setting slurm flags os.environ['MASTER_PORT'] = str(np.random.randint(12000, 19000, 1)[0]) os.environ['SLURM_LOCALID'] = str(0) hparams = get_hparams() model = LightningTestModel(hparams) trainer_options = dict(show_progress_bar=True, max_nb_epochs=1, gpus=[0], distributed_backend='ddp', use_amp=True) save_dir = init_save_dir() # exp file to get meta exp = get_exp(False) exp.argparse(hparams) exp.save() # exp file to get weights checkpoint = ModelCheckpoint(save_dir) # add these to the trainer options trainer_options['checkpoint_callback'] = checkpoint trainer_options['experiment'] = exp # fit model trainer = Trainer(**trainer_options) trainer.is_slurm_managing_tasks = True result = trainer.fit(model) # correct result and ok accuracy assert result == 1, 'amp + ddp model failed to complete' # test root model address assert trainer.resolve_root_node_address('abc') == 'abc' assert trainer.resolve_root_node_address('abc[23]') == 'abc23' assert trainer.resolve_root_node_address('abc[23-24]') == 'abc23' assert trainer.resolve_root_node_address( 'abc[23-24, 45-40, 40]') == 'abc23' # test model loading with a map_location map_location = 'cuda:1' pretrained_model = load_model(exp, save_dir, True, map_location) # test model preds run_prediction(model.test_dataloader, pretrained_model) if trainer.use_ddp: # on hpc this would work fine... but need to hack it for the purpose of the test trainer.model = pretrained_model trainer.optimizers, trainer.lr_schedulers = pretrained_model.configure_optimizers( ) # test HPC loading / saving trainer.hpc_save(save_dir, exp) trainer.hpc_load(save_dir, on_gpu=True) # test freeze on gpu model.freeze() model.unfreeze() clear_save_dir()

Exemplo n.º 7

0

Exibir arquivo

Arquivo: test_models.py Projeto: yanchao0222/pytorch-lightning

def test_amp_gpu_ddp_slurm_managed(): """ Make sure DDP + AMP work :return: """ if not can_run_gpu_test(): return reset_seed() # simulate setting slurm flags set_random_master_port() os.environ['SLURM_LOCALID'] = str(0) hparams = get_hparams() model = LightningTestModel(hparams) trainer_options = dict(show_progress_bar=True, max_nb_epochs=1, gpus=[0], distributed_backend='ddp', use_amp=True) save_dir = init_save_dir() # exp file to get meta logger = get_test_tube_logger(False) # exp file to get weights checkpoint = init_checkpoint_callback(logger) # add these to the trainer options trainer_options['checkpoint_callback'] = checkpoint trainer_options['logger'] = logger # fit model trainer = Trainer(**trainer_options) trainer.is_slurm_managing_tasks = True result = trainer.fit(model) # correct result and ok accuracy assert result == 1, 'amp + ddp model failed to complete' # test root model address assert trainer.resolve_root_node_address('abc') == 'abc' assert trainer.resolve_root_node_address('abc[23]') == 'abc23' assert trainer.resolve_root_node_address('abc[23-24]') == 'abc23' assert trainer.resolve_root_node_address( 'abc[23-24, 45-40, 40]') == 'abc23' # test model loading with a map_location pretrained_model = load_model(logger.experiment, trainer.checkpoint_callback.filepath) # test model preds [ run_prediction(dataloader, pretrained_model) for dataloader in trainer.get_test_dataloaders() ] if trainer.use_ddp: # on hpc this would work fine... but need to hack it for the purpose of the test trainer.model = pretrained_model trainer.optimizers, trainer.lr_schedulers = pretrained_model.configure_optimizers( ) # test HPC loading / saving trainer.hpc_save(save_dir, logger) trainer.hpc_load(save_dir, on_gpu=True) # test freeze on gpu model.freeze() model.unfreeze() clear_save_dir()