Python PrioritizedReplayBuffer.get_max_priority示例

编程语言: Python

命名空间/包名称: cpprb

方法/功能: get_max_priority

hotexamples.com的示例: 2

Python PrioritizedReplayBuffer.get_max_priority - 已找到2个示例。这些是从开源项目中提取的最受好评的cpprb.PrioritizedReplayBuffer.get_max_priority现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

PrioritizedReplayBuffer(27)

add(20)

sample(16)

update_priorities(11)

get_stored_size(5)

on_episode_end(3)

clear(2)

get_max_priority(2)

get_all_transitions(1)

get_buffer_size(1)

get_next_index(1)

示例#1

显示文件

文件： v8.py 项目： ymd-h/cpprb

    def test_sample(self):
        buffer_size = 500
        obs_shape = (84, 84, 3)
        act_dim = 4

        rb = PrioritizedReplayBuffer(buffer_size, {
            "obs": {
                "shape": obs_shape
            },
            "act": {
                "shape": act_dim
            },
            "rew": {},
            "done": {}
        },
                                     next_of="obs")

        obs = np.zeros(obs_shape)
        act = np.ones(act_dim)
        rew = 1
        done = 0

        rb.add(obs=obs, act=act, rew=rew, next_obs=obs, done=done)

        ps = 1.5

        rb.add(obs=obs,
               act=act,
               rew=rew,
               next_obs=obs,
               done=done,
               priorities=ps)

        self.assertAlmostEqual(rb.get_max_priority(), 1.5)

        obs = np.stack((obs, obs))
        act = np.stack((act, act))
        rew = (1, 0)
        done = (0.0, 1.0)

        rb.add(obs=obs, act=act, rew=rew, next_obs=obs, done=done)

        ps = (0.2, 0.4)
        rb.add(obs=obs,
               act=act,
               rew=rew,
               next_obs=obs,
               done=done,
               priorities=ps)

        sample = rb.sample(64)

        w = sample["weights"]
        i = sample["indexes"]

        rb.update_priorities(i, w * w)

示例#2

显示文件

文件： v8.py 项目： ymd-h/cpprb

    def test_add(self):
        buffer_size = 500
        obs_shape = (84, 84, 3)
        act_dim = 10

        rb = PrioritizedReplayBuffer(buffer_size, {
            "obs": {
                "shape": obs_shape
            },
            "act": {
                "shape": act_dim
            },
            "rew": {},
            "done": {}
        },
                                     next_of=("obs"))

        obs = np.zeros(obs_shape)
        act = np.ones(act_dim)
        rew = 1
        done = 0

        rb.add(obs=obs, act=act, rew=rew, next_obs=obs, done=done)

        ps = 1.5

        rb.add(obs=obs,
               act=act,
               rew=rew,
               next_obs=obs,
               done=done,
               priorities=ps)

        self.assertAlmostEqual(rb.get_max_priority(), 1.5)

        obs = np.stack((obs, obs))
        act = np.stack((act, act))
        rew = (1, 0)
        done = (0.0, 1.0)

        rb.add(obs=obs, act=act, rew=rew, next_obs=obs, done=done)

        ps = (0.2, 0.4)
        rb.add(obs=obs,
               act=act,
               rew=rew,
               next_obs=obs,
               done=done,
               priorities=ps)

        rb.clear()
        self.assertEqual(rb.get_next_index(), 0)
        self.assertEqual(rb.get_stored_size(), 0)