Python Reacher 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: reacher

클래스/타입: Reacher

hotexamples.com에서의 예제들: 1

Python Reacher - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 reacher.Reacher에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

step(5)

reset(5)

Reacher(4)

render(3)

close(1)

episode_finish(1)

episode_start(1)

episode_step(1)

get_state(1)

halted(1)

initialize_camera(1)

예제 #1

파일 보기

파일: ppo_single_2.py 프로젝트: ZhichenML/STOA-RL-Algorithms

        saver = tf.train.Saver()
        saver.save(self.sess, path)

    def load(self, path):
        saver = tf.train.Saver()
        saver.restore(self.sess, path)


NUM_JOINTS = 2
LINK_LENGTH = [200, 140]
INI_JOING_ANGLES = [0.1, 0.1]
SCREEN_SIZE = 1000
SPARSE_REWARD = False
SCREEN_SHOT = False
DETERMINISTIC = False
env=Reacher(screen_size=SCREEN_SIZE, num_joints=NUM_JOINTS, link_lengths = LINK_LENGTH, \
    ini_joint_angles=INI_JOING_ANGLES, target_pos = [369,430], render=True)
ppo = PPO()

if args.train:
    all_ep_r = []

    for ep in range(EP_MAX):
        s = env.reset(SCREEN_SHOT)
        s = s / 100.
        buffer_s, buffer_a, buffer_r = [], [], []
        ep_r = 0
        for t in range(EP_LEN):  # in one episode
            # env.render()
            a = ppo.choose_action(s)
            s_, r, done, distance2goal = env.step(a, SPARSE_REWARD,
                                                  SCREEN_SHOT)