Esempi in Python per NoReplacementQueue.sample

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: flare.common.replay_buffer

Classe/tipologia: NoReplacementQueue

Metodo/funzione: sample

Esempi su hotexamples.com: 2

NoReplacementQueue.sample in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per flare.common.replay_buffer.NoReplacementQueue.sample, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

NoReplacementQueue(2)

add(2)

sample(2)

Metodi utilizzati di frequente

NoReplacementQueue (2)

add (2)

sample (2)

Esempio n. 1

Mostra file

File: test_replay_buffer.py Progetto: ziyuli/flare

 def test_sampling(self):
     exp_q = NoReplacementQueue()
     #          obs           r    a    e
     exp_q.add((np.zeros(10), [1], [1], [0]))
     exp_q.add((np.zeros(10), [0], [-1], [1]))  # 1st episode end
     exp_q.add((np.zeros(10), [1], [2], [0]))
     exp_q.add((np.zeros(10), [1], [3], [0]))
     exp_q.add((np.zeros(10), [1], [4], [0]))
     exp_seqs = exp_q.sample(self.is_episode_end)
     self.assertEqual(len(exp_q), 1)
     self.assertEqual(len(exp_seqs), 2)
     self.assertEqual(len(exp_seqs[0]), 2)
     self.assertEqual(exp_seqs[0][0][2], [1])
     self.assertEqual(exp_seqs[0][1][2], [-1])
     self.assertEqual(len(exp_seqs[1]), 3)
     self.assertEqual(exp_seqs[1][0][2], [2])
     self.assertEqual(exp_seqs[1][1][2], [3])
     self.assertEqual(exp_seqs[1][2][2], [4])
     #          obs           r    a    e
     exp_q.add((np.zeros(10), [0], [-2], [1]))
     exp_seqs = exp_q.sample(self.is_episode_end)
     self.assertEqual(len(exp_q), 0)
     self.assertEqual(len(exp_seqs), 1)
     self.assertEqual(len(exp_seqs[0]), 2)
     self.assertEqual(exp_seqs[0][0][2], [4])
     self.assertEqual(exp_seqs[0][1][2], [-2])
     self.assertEqual(len(exp_q), 0)

Esempio n. 2

Mostra file

File: agent.py Progetto: wangyang59/flare

class OnlineHelper(AgentHelper):
    """
    Online helper. It calls `learn()` every `sample_interval`
    steps.

    While waiting for learning return, the calling `Agent` is blocked.
    """
    def __init__(self, name, communicator, sample_interval=5):
        super(OnlineHelper, self).__init__(name, communicator, sample_interval)
        # NoReplacementQueue used to store past experience.
        self.exp_queue = NoReplacementQueue()

    @staticmethod
    def exp_replay():
        return False

    def add_experience(self, e):
        self.exp_queue.add(e)

    def sample_experiences(self):
        return self.exp_queue.sample()