Python AverageMeter.step 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: helper

클래스/타입: AverageMeter

메소드/함수: step

hotexamples.com에서의 예제들: 2

Python AverageMeter.step - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 helper.AverageMeter.step에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

AverageMeter(30)

get_average(3)

append(2)

step(2)

reset(1)

예제 #1

파일 보기

                # Computing actions by using FDDR
                delta = fddr(fragments, running_mean=mean,
                             running_var=var).double().squeeze(-1)

                # Computing reward
                pad_delta = F.pad(delta, [1, 0])
                delta_diff = (pad_delta[:, 1:] - pad_delta[:, :-1])
                reward = torch.sum(delta * returns - c * torch.abs(delta_diff))

                test_reward_meter.append(reward.item())

        progress_bar.set_description(
            '[Epoch %d][Iteration %d][Reward: train = %.4f, test = %.4f]' %
            (e, i, train_reward_meter.get_average(-1),
             test_reward_meter.get_average(-1)))

        if e % save_per_epoch == 0:
            torch.save(fddr.state_dict(), os.path.join(log_src, 'fddrl.pkl'))
        train_reward_meter.step()
        test_reward_meter.step()

# Save the model and reward history
torch.save(fddr.state_dict(), os.path.join(log_src, 'fddrl.pkl'))
np.save(os.path.join(log_src, 'fddrl_reward.npy'),
        train_reward_meter.get_average())

# Plot the reward curve
plt.plot(train_reward_meter.get_average())
plt.plot(test_reward_meter.get_average())
plt.show()

예제 #2

파일 보기

파일: baseline_drl.py 프로젝트: Pandede/FDRNN

            # Computing actions by using FDDR
            delta = drl(fragments).double().squeeze(-1)

            # Computing reward
            pad_delta = F.pad(delta, [1, 0])
            delta_diff = (pad_delta[:, 1:] - pad_delta[:, :-1])
            reward = torch.sum(delta * returns - c * torch.abs(delta_diff))

            # Updating FDDR
            optimizer.zero_grad()
            (-reward).backward()
            optimizer.step()

            # Recording and showing the information
            reward_meter.append(reward.item())
            progress_bar.set_description(
                '[Epoch %d][Iteration %d][Reward: %.4f]' % (e, i, reward_meter.get_average(-1)))
            progress_bar.update()

        if e % save_per_epoch == 0:
            torch.save(drl.state_dict(), os.path.join(log_src, 'drl.pkl'))
        reward_meter.step()

# Save the model and reward history
torch.save(drl.state_dict(), os.path.join(log_src, 'drl.pkl'))
np.save(os.path.join(log_src, 'drl_reward.npy'), reward_meter.get_average())

# Plot the reward curve
plt.plot(reward_meter.get_average())
plt.show()