Python KukaDiverseObjectEnv.render 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: pybullet_envs.bullet.kuka_diverse_object_gym_env

클래스/타입: KukaDiverseObjectEnv

메소드/함수: render

hotexamples.com에서의 예제들: 3

Python KukaDiverseObjectEnv.render - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 pybullet_envs.bullet.kuka_diverse_object_gym_env.KukaDiverseObjectEnv.render에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

KukaDiverseObjectEnv(11)

reset(5)

observation_space(2)

render(2)

seed(2)

step(2)

cid(1)

close(1)

예제 #1

파일 보기

파일: enjoy_kuka_diverse_object_grasping.py 프로젝트: AndrewMeadows/bullet3

def main():
    
    env = KukaDiverseObjectEnv(renders=True, isDiscrete=False)
    policy = ContinuousDownwardBiasPolicy()

    while True:
        obs, done = env.reset(), False
        print("===================================")        
        print("obs")
        print(obs)
        episode_rew = 0
        while not done:
            env.render(mode='human')
            act = policy.sample_action(obs, .1)
            print("Action")
            print(act)
            obs, rew, done, _ = env.step([0, 0, 0, 0, 0])
            episode_rew += rew
        print("Episode reward", episode_rew)

예제 #2

파일 보기

파일: enjoy_kuka_diverse_object_grasping.py 프로젝트: xiaoerlaigeid/bullet3

def main():

    env = KukaDiverseObjectEnv(renders=True, isDiscrete=False)
    policy = ContinuousDownwardBiasPolicy()

    while True:
        obs, done = env.reset(), False
        print("===================================")
        print("obs")
        print(obs)
        episode_rew = 0
        while not done:
            env.render()
            act = policy.sample_action(obs, .1)
            print("Action")
            print(act)
            obs, rew, done, _ = env.step([0, 0, 0, 0, 0])
            episode_rew += rew
        print("Episode reward", episode_rew)

예제 #3

파일 보기

파일: main.py 프로젝트: KaiFukazawa/RL-Projects-SK

        ep_reward_list = []
        avg_reward_list = []

    actor_loss, critic_loss = 0, 0
    best_score = -np.inf
    print('Main training loop')
    for episode in range(start_episode, MAX_EPISODES):
        obsv = env.reset()
        state = np.asarray(
            obsv, dtype=np.float32) / 255.0  # convert into float array
        episodic_reward = 0
        frames = []
        steps = 0
        while True:
            if episode > MAX_EPISODES - 3:
                frames.append(env.render(mode='rgb_array'))

            # take an action as per the policy
            if episode < RAND_EPS:  # explore for some episodes
                action = env.action_space.sample()
            else:
                action = agent.policy(state)

            # obtain next state and rewards

            next_obsv, reward, done, info = env.step(action)
            next_state = np.asarray(
                next_obsv,
                dtype=np.float32) / 255.0  # convert into float array

            #tb_img = np.reshape(next_state, (-1, 48, 48, 3))  # for tensorboard