Python MLP.parametersの例

プログラミング言語: Python

名前空間/パッケージ名: nn

クラス/型: MLP

メソッド/関数: parameters

hotexamples.comのコード掲載数: 2

Python MLP.parameters - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのnn.MLP.parametersの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

MLP(17)

parameters(2)

run(1)

validationLabels(1)

validationFeatures(1)

validateModel(1)

trainingIterations(1)

train(1)

trackLearning(1)

topology(1)

setupHiddenLayers(1)

predict(1)

addLayer(1)

plotLearning(1)

meta(1)

load_state_dict(1)

labels(1)

initalWeightsMultiplier(1)

init_weights(1)

features(1)

eval(1)

zero_grad(1)

コード例 #1

ファイルを表示

ファイル: main.py プロジェクト: LiamHz/tiny-autodiff

def main():
  lr = 0.001
  input_size = 50
  output_size = 10
  n_iterations = 100

  # Both input and "ground truth" are random vectors
  x = np.random.random(input_size)
  y = np.random.random(output_size)

  # Randomly initialize neural network weights
  #weights = to_value(np.random.random((input_size, output_size)))
  nn = MLP(input_size, output_size, [5, 10, 20])
  print(nn.layers[0])

  losses = []
  for i in tqdm(range(100)):
    y_pred = nn(x)
    loss = np.sum((y - y_pred) * (y - y_pred))
    losses.append(loss.data)

    loss.backward()
    for p in nn.parameters():
      p.data -= lr * p.grad

    nn.zero_grad()

  plt.plot(losses)
  plt.ylabel('Loss')
  plt.xlabel('Iteration')
  plt.title('Multilayer perceptron fitting random noise')
  plt.show()

コード例 #2

ファイルを表示

class Policy(object):
    def __init__(self, input_dim, n_actions, gamma=0.9):
        self.input_dim = input_dim
        self.n_actions = n_actions
        self.gamma = gamma

        self.model = MLP(input_dim, [32, 32], n_actions)
        self.optim = optim.Adam(self.model.parameters(), lr=1e-2)

        self.action_reward = []

    def get_action(self, observation, stochastic=True):
        pred = self.model(observation)

        if stochastic:
            return pred.multinomial()
        return pred[0].argmax()

    def update(self):
        R = 0
        rewards = []
        for action, reward in self.action_reward:
            R = reward + self.gamma * R
            rewards.insert(0, R)

        rewards = T.Tensor(rewards)
        rewards = (rewards - rewards.mean()) / (rewards.std() +
                                                np.finfo(np.float32).eps)

        actions = []
        for (action, _), reward in zip(self.action_reward, rewards):
            action.reinforce(reward)
            actions.append(action)

        self.optim.zero_grad()
        T.autograd.backward(actions, [None for _ in actions])
        self.optim.step()

        self.action_reward = []

    def record(self, action, reward):
        self.action_reward.append((action, reward))