Python distributed_main 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: distributed_train

메소드/함수: distributed_main

hotexamples.com에서의 예제들: 5

Python distributed_main - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 distributed_train.distributed_main에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: train.py 프로젝트: SCUZPP/ENAS

def train_model(args, encoder_seq, encoder_para, decoder_seq, decoder_para):

    parser = options.get_training_parser()
    args = options.parse_args_and_arch(parser)
    args.ddp_backend = 'no_c10d'
    args.encoder_seq = encoder_seq
    args.encoder_para = encoder_para

    args.decoder_seq = decoder_seq
    args.decoder_para = decoder_para

    #print('args.arch', args.arch)
    #print('max-tokens', args.max_tokens)
    if args.distributed_port > 0 or args.distributed_init_method is not None:
        #print('0')
        from distributed_train import main as distributed_main

        distributed_main(args)
    elif args.distributed_world_size > 1:
        #print('1')
        from multiprocessing_train import main as multiprocessing_main

        multiprocessing_main(args)
    else:
        #print('2')
        main(args)

예제 #2

파일 보기

파일: multiobj_train.py 프로젝트: xianxl/fairseq

def cli_main():
    # Horrible hack, please close your eyes and don't look
    cli_args = set(sys.argv)
    print("Command line argumetns")
    print(cli_args)
    if "--arch" not in cli_args and "-a" not in cli_args:
        sys.argv.append("--arch")
        sys.argv.append("transformer_iwslt_de_en")
    print(cli_args)
    # It's over now you can look
    parser = options.get_training_parser()
    add_multiobj_args(parser)
    args = options.parse_args_and_arch(parser)

    if args.distributed_port > 0 or args.distributed_init_method is not None:
        raise NotImplementedError(
            "Multitask doesn't support multiprocessing yet")
        from distributed_train import main as distributed_main

        distributed_main(args)
    elif args.distributed_world_size > 1:
        raise NotImplementedError(
            "Multitask doesn't support multiprocessing yet")
        from multiprocessing_train import main as multiprocessing_main

        multiprocessing_main(args)
    else:
        main(args)

예제 #3

파일 보기

def main(args):
    if args.distributed_port > 0 \
            or args.distributed_init_method is not None:
        distributed_main(args)
    elif args.distributed_world_size > 1:
        multiprocessing_main(args)
    else:
        singleprocess_main(args)

예제 #4

파일 보기

파일: train.py 프로젝트: sk210892/fairseq


def load_dataset_splits(args, task, splits):
    for split in splits:
        for k in itertools.count():
            split_k = split + (str(k) if k > 0 else '')
            try:
                task.load_dataset(split_k)
                print('| {} {} {} examples'.format(args.data, split_k,
                                                   len(task.dataset(split_k))))
            except FileNotFoundError as e:
                if k > 0:
                    break
                raise e


if __name__ == '__main__':
    parser = options.get_training_parser()
    args = options.parse_args_and_arch(parser)

    if args.distributed_port > 0 or args.distributed_init_method is not None:
        from distributed_train import main as distributed_main

        distributed_main(args)
    elif args.distributed_world_size > 1:
        from multiprocessing_train import main as multiprocessing_main

        multiprocessing_main(args)
    else:
        main(args)

예제 #5

파일 보기

파일: train.py 프로젝트: zyzhang1992/DeepLearningExamples

def load_checkpoint(args, trainer, epoch_itr):
    """Load a checkpoint and replay dataloader to match."""
    os.makedirs(os.path.join(args.save_dir, 'checkpoints'), exist_ok=True)
    checkpoint_path = os.path.join(args.save_dir, 'checkpoints',
                                   args.restore_file)
    if os.path.isfile(checkpoint_path):
        extra_state = trainer.load_checkpoint(checkpoint_path)
        if extra_state is not None:
            # replay train iterator to match checkpoint
            epoch_itr.load_state_dict(extra_state['train_iterator'])

            print('| loaded checkpoint {} (epoch {} @ {} updates)'.format(
                checkpoint_path, epoch_itr.epoch, trainer.get_num_updates()))

            trainer.lr_step(epoch_itr.epoch)
            trainer.lr_step_update(trainer.get_num_updates())
            if 'best' in extra_state:
                save_checkpoint.best = extra_state['best']


if __name__ == '__main__':
    parser = options.get_training_parser()
    ARGS = options.parse_args_and_arch(parser)

    if ARGS.distributed_port > 0 or ARGS.distributed_init_method is not None:
        from distributed_train import main as distributed_main

        distributed_main(ARGS)
    else:
        main(ARGS)