Python SumTree.max Beispiele

Programmiersprache: Python

Namespace / Paketname: sum_tree

Klasse / Typ: SumTree

Methode / Funktion: max

Beispiele auf hotexamples.com: 2

Python SumTree.max - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die sum_tree.SumTree.max, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

SumTree(30)

update(28)

get(21)

add(19)

total(18)

sample(5)

get_leaf(4)

total_p(2)

max(2)

update_priority(2)

insert(1)

get_total(1)

get_sample(1)

max_p(1)

priority_total(1)

get_min(1)

sum_of_tree(1)

getCount(1)

current_length(1)

total_sum(1)

add_memory(1)

length(1)

Beispiel #1

Datei anzeigen

Datei: agent.py Projekt: y-kamiya/RL-rainbow

class PERMemory:
    EPSILON = 0.0001
    ALPHA = 0.5
    BETA = 0.4
    size = 0

    def __init__(self, config, capacity):
        self.config = config
        self.capacity = capacity
        self.tree = SumTree(capacity)

    def _getPriority(self, td_error):
        return (td_error + self.EPSILON) ** self.ALPHA

    def push(self, transition):
        self.size += 1

        priority = self.tree.max()
        if priority <= 0:
            priority = 1

        self.tree.add(priority, transition)

    def sample(self, size, episode):
        list = []
        indexes = []
        weights = np.empty(size, dtype='float32')
        total = self.tree.total()
        beta = self.BETA + (1 - self.BETA) * episode / self.config.num_episodes
        beta = min(1.0, beta)

        for i, rand in enumerate(np.random.uniform(0, total, size)):
            (idx, priority, data) = self.tree.get(rand)
            list.append(data)
            indexes.append(idx)
            weights[i] = (self.capacity * priority / total) ** (-beta)

        return (indexes, list, weights / weights.max())

    def update(self, idx, td_error):
        priority = self._getPriority(td_error)
        self.tree.update(idx, priority)

    def __len__(self):
        return self.size

Beispiel #2

Datei anzeigen

Datei: replay_memory.py Projekt: KNakane/tensorflow

class PrioritizeReplayBuffer(ReplayBuffer):
    # Based on https://github.com/y-kamiya/machine-learning-samples/blob/7b6792ce37cc69051e9053afeddc6d485ad34e79/python3/reinforcement/dqn/agent.py
    EPSILON = 0.0001
    ALPHA = 0.6
    BETA = 0.4
    size = 0

    def __init__(self, capacity):
        super().__init__(capacity=capacity)
        self.td_error_epsilon = 0.0001
        self.tree = SumTree(capacity)

    def __len__(self):
        return self.size

    def _getPriority(self, td_error):
        return (td_error + self.EPSILON)**self.ALPHA

    def push(self, state, action, done, next_state, reward, p_index):
        self.size += 1
        transition = self.Transition(state, action, done, next_state, reward,
                                     p_index)
        priority = self.tree.max()
        if priority <= 0:
            priority = 1
        self.tree.add(priority, transition)

    def sample(self, batch_size, episode):
        list = []
        indexes = []
        weights = np.empty(batch_size, dtype='float32')
        total = self.tree.total()
        beta = self.BETA + (
            1 - self.BETA) * episode  #episode / self.config.num_episodes

        for i, rand in enumerate(np.random.uniform(0, total, batch_size)):
            (idx, priority, data) = self.tree.get(rand)
            list.append(data)
            indexes.append(idx)
            weights[i] = (self.capacity * priority / total)**(-beta)
        return (indexes, list, weights / weights.max())

    def update(self, idx, td_error):
        priority = self._getPriority(td_error)
        self.tree.update(idx, priority)