Python Linear.no_sync Beispiele

Programmiersprache: Python

Namespace / Paketname: torch.nn

Klasse / Typ: Linear

Methode / Funktion: no_sync

Beispiele auf hotexamples.com: 1

Python Linear.no_sync - 1 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die torch.nn.Linear.no_sync, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Linear(30)

parameters(30)

reset_parameters(30)

to(26)

cuda(10)

state_dict(9)

__init__(6)

weight(6)

forward(6)

apply(5)

train(5)

load_state_dict(5)

modules(4)

bias(3)

eval(2)

in_features(2)

out_features(2)

total_ops(1)

summon_full_params(1)

no_sync(1)

register_forward_hook(1)

register_buffer(1)

d_flops_out(1)

d_flops_in(1)

_summon_full_params(1)

zero_grad(1)

Beispiel #1

Datei anzeigen

def _test_grad_accum_func(rank, world_size, tempfile_name):
    _dist_init(rank, world_size, tempfile_name, backend="gloo")  # Covers gloo

    model = Linear(4, 2, bias=False)
    model.to("cuda")
    model = DDP(model, device_ids=[rank])
    optim = AdaScale(SGD(model.parameters(), lr=0.1), num_gradients_to_accumulate=2)
    with model.no_sync():
        # iter 1, input vectors are pointing dim0 and dim1
        in_data = Tensor([0.0] * 4)
        in_data[rank] = 1.0
        in_data = in_data.cuda()
        out = model(in_data)
        out.sum().backward()
    # iter 2, input vectors are pointing dim2 and dim3
    in_data = Tensor([0.0] * 4)
    in_data[rank + 2] = 1.0
    in_data = in_data.cuda()
    out = model(in_data)
    out.sum().backward()
    # since all inputs are orthogonal, the gain should be exactly 4.0.
    assert np.allclose(optim.gain(), 4.0), optim.gain()
    optim.step()
    optim.zero_grad()

    dist.destroy_process_group()