Python multi_init示例

编程语言: Python

命名空间/包名称: distributed

方法/功能: multi_init

hotexamples.com的示例: 2

Python multi_init - 已找到2个示例。这些是从开源项目中提取的最受好评的distributed.multi_init现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

def run(args, device_id, error_queue):
    """ run process """
    setattr(args, 'gpu_ranks', [int(i) for i in args.gpu_ranks])
    try:
        gpu_rank = distributed.multi_init(device_id, args.world_size,
                                          args.gpu_ranks, args.init_method)
        print('gpu_rank %d' % gpu_rank)
        if gpu_rank != args.gpu_ranks[device_id]:
            raise AssertionError("An error occurred in \
                  Distributed initialization")

        recover_all = False
        pt = None
        if args.recover_from != '':
            pt = args.recover_from
            recover_all = True
        elif args.extract_model != '':
            pt = args.extract_model

        if args.mode == 'abs':
            abs_train(args, device_id, pt, recover_all)
        else:
            train(args, device_id)
    except KeyboardInterrupt:
        pass  # killed by parent, do nothing
    except Exception:
        # propagate exception to parent process, keeping original traceback
        import traceback
        error_queue.put((args.gpu_ranks[device_id], traceback.format_exc()))

示例#2

显示文件

def run(args, device_id, error_queue):
    """ run process """
    setattr(args, 'gpu_ranks', [int(i) for i in args.gpu_ranks])

    try:
        gpu_rank = distributed.multi_init(device_id, args.world_size, args.gpu_ranks)
        print('gpu_rank %d' % gpu_rank)
        if gpu_rank != args.gpu_ranks[device_id]:
            raise AssertionError("An error occurred in \
                  Distributed initialization")

        train_single_ext(args, device_id)
    except KeyboardInterrupt:
        pass  # killed by parent, do nothing
    except Exception:
        # propagate exception to parent process, keeping original traceback
        import traceback
        error_queue.put((args.gpu_ranks[device_id], traceback.format_exc()))