Python BaseEnv示例

编程语言: Python

命名空间/包名称: env.Bomberman.base_env

类/类型: BaseEnv

hotexamples.com的示例: 7

Python BaseEnv - 已找到7个示例。这些是从开源项目中提取的最受好评的env.Bomberman.base_env.BaseEnv现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

BaseEnv(3)

reset(3)

step(2)

current_step(1)

get_reward(1)

render(1)

示例#1

显示文件

def test_get_reward(base_env: BaseEnv):
    base_env.reset()
    obs, reward, done, _ = base_env.step(4)

    base_env.state.score_item = [10, 200, -500, 500]
    assert reward == -0.01
    assert base_env.get_reward() == 30

示例#2

显示文件

def test_render(base_env: BaseEnv):
    with mock.patch.object(base_env_py.time, "sleep") as mock_sleep:
        base_env.render(10000)

    assert mock_sleep.call_args[0][0] == 10000

    with mock.patch.object(base_env_py.os, "system") as mock_system:
        base_env.render(0)

    assert mock_system.called

示例#3

显示文件

def test_step(base_env: BaseEnv):
    base_env.reset()
    obs, reward, done, _ = base_env.step(5)
    assert reward == 0.01
    assert not done

    obs, reward, done, _ = base_env.step(2)
    assert reward == -0.01
    assert base_env.state.get_bomberman().get_direction() == 'East'

    obs, reward, done, _ = base_env.step(2)
    assert reward == -0.01
    assert base_env.state.get_bomberman().get_direction() == 'East'

    obs, reward, done, _ = base_env.step(2)
    assert reward == -0.01
    assert base_env.state.get_bomberman().get_direction() == 'East'

    obs, reward, done, _ = base_env.step(4)
    assert reward == -0.01

    obs, reward, done, _ = base_env.step(4)
    assert reward == 10

    bomb = Bomb((3, 3))
    bomb.countdown = 1
    base_env.state.get_bombs().append(bomb)

    obs, reward, done, _ = base_env.step(4)
    assert reward == 80
    assert done

示例#4

显示文件

文件： run_base_env.py 项目： Sean2525/ConsoleGame-ActionMask.Gym

from examples.utils.utils import get_policy

tensorboard_folder = './tensorboard/Bomberman/base/'
model_folder = './models/Bomberman/base/'
if not os.path.isdir(tensorboard_folder):
    os.makedirs(tensorboard_folder)
if not os.path.isdir(model_folder):
    os.makedirs(model_folder)

policy = ''
model_tag = ''
if len(sys.argv) > 1:
    policy = sys.argv[1]
    model_tag = '_' + sys.argv[1]

env = DummyVecEnv([lambda: BaseEnv()])
env = VecFrameStack(env, 3)

model = A2C(get_policy(policy),
            env,
            verbose=0,
            tensorboard_log=tensorboard_folder)
model.learn(total_timesteps=2500000, tb_log_name='A2C' + model_tag)

model.save(model_folder + "A2C" + model_tag)
del model
model = A2C.load(model_folder + "A2C" + model_tag)

done = False
states = None
obs = env.reset()

示例#5

显示文件

文件： conftest.py 项目： Sean2525/ConsoleGame-ActionMask.Gym

def state():
    return BaseEnv('test_map').state

示例#6

显示文件

文件： conftest.py 项目： Sean2525/ConsoleGame-ActionMask.Gym

def base_env():
    return BaseEnv('test_map')

示例#7

显示文件

def test_reset(base_env: BaseEnv):
    base_env.current_step = 1
    base_env.reset()
    assert base_env.current_step == 0