Exemplos de SumTree.max em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: sum_tree

Classe / Tipo: SumTree

Método / Função: max

Exemplos em hotexamples.com: 2

SumTree.max em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de sum_tree.SumTree.max em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

SumTree(30)

update(28)

get(21)

add(19)

total(18)

sample(5)

get_leaf(4)

total_p(2)

max(2)

update_priority(2)

insert(1)

get_total(1)

get_sample(1)

max_p(1)

priority_total(1)

get_min(1)

sum_of_tree(1)

getCount(1)

current_length(1)

total_sum(1)

add_memory(1)

length(1)

Métodos Frequentes

SumTree (30)

update (28)

get (21)

add (19)

total (18)

sample (5)

get_leaf (4)

total_p (2)

max (2)

update_priority (2)

Métodos Frequentes

insert (1)

get_total (1)

get_sample (1)

max_p (1)

priority_total (1)

get_min (1)

sum_of_tree (1)

getCount (1)

current_length (1)

total_sum (1)

add_memory (1)

length (1)

Métodos Frequentes

add_memory (1)

length (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: agent.py Projeto: y-kamiya/RL-rainbow

class PERMemory: EPSILON = 0.0001 ALPHA = 0.5 BETA = 0.4 size = 0 def __init__(self, config, capacity): self.config = config self.capacity = capacity self.tree = SumTree(capacity) def _getPriority(self, td_error): return (td_error + self.EPSILON) ** self.ALPHA def push(self, transition): self.size += 1 priority = self.tree.max() if priority <= 0: priority = 1 self.tree.add(priority, transition) def sample(self, size, episode): list = [] indexes = [] weights = np.empty(size, dtype='float32') total = self.tree.total() beta = self.BETA + (1 - self.BETA) * episode / self.config.num_episodes beta = min(1.0, beta) for i, rand in enumerate(np.random.uniform(0, total, size)): (idx, priority, data) = self.tree.get(rand) list.append(data) indexes.append(idx) weights[i] = (self.capacity * priority / total) ** (-beta) return (indexes, list, weights / weights.max()) def update(self, idx, td_error): priority = self._getPriority(td_error) self.tree.update(idx, priority) def __len__(self): return self.size

Exemplo n.º 2

0

Exibir arquivo

Arquivo: replay_memory.py Projeto: KNakane/tensorflow

class PrioritizeReplayBuffer(ReplayBuffer): # Based on https://github.com/y-kamiya/machine-learning-samples/blob/7b6792ce37cc69051e9053afeddc6d485ad34e79/python3/reinforcement/dqn/agent.py EPSILON = 0.0001 ALPHA = 0.6 BETA = 0.4 size = 0 def __init__(self, capacity): super().__init__(capacity=capacity) self.td_error_epsilon = 0.0001 self.tree = SumTree(capacity) def __len__(self): return self.size def _getPriority(self, td_error): return (td_error + self.EPSILON)**self.ALPHA def push(self, state, action, done, next_state, reward, p_index): self.size += 1 transition = self.Transition(state, action, done, next_state, reward, p_index) priority = self.tree.max() if priority <= 0: priority = 1 self.tree.add(priority, transition) def sample(self, batch_size, episode): list = [] indexes = [] weights = np.empty(batch_size, dtype='float32') total = self.tree.total() beta = self.BETA + ( 1 - self.BETA) * episode #episode / self.config.num_episodes for i, rand in enumerate(np.random.uniform(0, total, batch_size)): (idx, priority, data) = self.tree.get(rand) list.append(data) indexes.append(idx) weights[i] = (self.capacity * priority / total)**(-beta) return (indexes, list, weights / weights.max()) def update(self, idx, td_error): priority = self._getPriority(td_error) self.tree.update(idx, priority)