Python MLP.forward_keep_activations Examples

Programming Language: Python

Namespace/Package Name: MLP

Class/Type: MLP

Method/Function: forward_keep_activations

Examples at hotexamples.com: 1

Python MLP.forward_keep_activations - 1 examples found. These are the top rated real world Python examples of MLP.MLP.forward_keep_activations extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

MLP(30)

fit(25)

forward(6)

errors(5)

cuda(4)

backward(4)

build(3)

get_activations_and_units(3)

get_action(3)

eval(3)

get_data(2)

create_network(2)

application(2)

evaluate_action_RL(2)

accuracy(2)

gradient_descend(2)

feedforward(2)

backpropagation(2)

new_game(2)

output_error_calculation(2)

backwards(2)

set_data(2)

close(2)

getDropoutRate(2)

calculateDataSize(2)

estimate(2)

get_Temperature(1)

getLoss(1)

get_MLP_data(1)

binary_cross_entropy(1)

Params(1)

MSE(1)

get_buffer_length(1)

negativeLogLikelihood(1)

save_weights(1)

train1(1)

validate(1)

freeze(1)

filtresBias(1)

forward_keep_activations(1)

dimConv(1)

classify_batch(1)

compile(1)

conf_mat(1)

confusionMatrix(1)

confusion_matrix(1)

creat2(1)

dAPreTraining(1)

dimInput(1)

fit_mb(1)

Example #1

Show file

File: RL.py Project: Tarkof/DRL

class RL_Agent():
    def __init__(self, episode_size=150):
        self.model = MLP((SCREEN_HEIGHT_g, SCREEN_WIDTH_g), 300)
        #self.load("models/model_1185.npz")
        self.activations = []
        self.frames = []
        self.states_alive = []

        self.episode_size = episode_size
        self.episode_decisions = np.zeros((8))

        self.episodes_wins = 0
        self.episodes_nb = 0
        self.iter = 0

    def explore_exploit(self, prediction):
        choice = np.random.rand()
        if choice <= .8:
            return prediction
        return one_hot(round(np.random.rand() * 7))

    def update(self, frame, is_dead):
        frame = preprocessing(frame)
        act_h, y_pred = self.model.forward_keep_activations(frame)
        y_pred = self.explore_exploit(y_pred)
        self.activations.append((act_h, y_pred))
        self.frames.append(frame)

        #print(y_pred)

        self.episode_decisions += one_hot(y_pred)

        self.iter += 1
        if is_dead or self.iter == self.episode_size:
            for activation, frame in zip(self.activations, self.frames):
                if is_dead:  # Agent is dead
                    #y_true = np.array([0, 0, 0, 0.5, 0.5, 0, 0, 0])
                    y_true = wrong_move(one_hot(activation[1]))
                    #print("\n", activation[1],'\n', y_true, '\n\n')
                    grads = self.model.gradients(frame, activation[0],
                                                 activation[1], y_true)
                    self.model.backward(grads)
                else:
                    y_true = one_hot(activation[1])
                    grads = self.model.gradients(frame, activation[0],
                                                 activation[1], y_true)
                    self.model.backward(grads)

            print(
                f"Episode #{self.episodes_nb} : {'LOSE' if is_dead else 'WIN'}   Decisions : {self.episode_decisions}"
            )

            self.reset()
            self.episodes_nb += 1
            self.episode_decisions.fill(0)

            if not is_dead:
                self.episodes_wins += 1

            if self.episodes_nb % 100 == 0:
                print(f"Last 100 episodes : {self.episodes_wins}%")
                self.episodes_wins = 0

        return np.argmax(y_pred)

    def reset(self):
        self.activations = []
        self.iter = 0

    def load(self, path):
        loaded = np.load(path)
        self.model.Wh = loaded['Wh']
        self.model.Bh = loaded['Bh']
        self.model.Wo = loaded['Wo']
        self.model.Bo = loaded['Bo']

    def save(self):
        np.savez_compressed("models/model_" + str(self.episodes_nb),
                            Wh=self.model.Wh,
                            Bh=self.model.Bh,
                            Wo=self.model.Wo,
                            Bo=self.model.Bo)