Python KitchenState 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: environment.kitchen

클래스/타입: KitchenState

hotexamples.com에서의 예제들: 2

Python KitchenState - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 environment.kitchen.KitchenState에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

KitchenState(2)

자주 사용되는 메소드들

KitchenState (2)

예제 #1

파일 보기

파일: kitchen_salt.py 프로젝트: praal/align

def evaluate_second_agent(env, policy1, reward1, env2, policy2, reward2):

    print("Acting agent enters")
    init = [1, 1]
    initial_state = KitchenState(init[0], init[1], set(), init[0], init[1])
    env.reset(initial_state)
    reward1.reset()
    policy1.reset(evaluation=True)
    trial_reward: float = 0.0
    for step in range(TEST_EPISODE_LENGTH):
        s0 = env.state
        a = policy1.get_best_action(s0)
        env.apply_action(a)
        s1 = env.state
        print_state(s0, a)
        step_reward, finished = reward1(s0, a, s1)
        if not finished:
            trial_reward += step_reward
        logging.debug("(%s, %s, %s) -> %s", s0, a, s1, step_reward)
        if finished:
            print_state(s1, -1)
            break

    facts = set()
    if env.state.facts[OBJECTS4["open"]]:
        facts.add(1)
    if env.state.facts[OBJECTS4["up"]]:
        facts.add(4)

    print("Agent 2 enters")
    env2.reset(KitchenState(init[0], init[1], facts, init[0], init[1]))

    trial_reward2 = 0
    for step in range(TEST_EPISODE_LENGTH):
        s0 = env2.state
        a = policy2.get_best_action(s0)
        env2.apply_action(a)
        s1 = env2.state
        print_state(s0, a)
        step_reward, finished = reward2(s0, a, s1)
        if not finished:
            trial_reward2 += step_reward
        logging.debug("(%s, %s, %s) -> %s", s0, a, s1, step_reward)
        if finished:
            print_state(s1, -1)
            break
    return trial_reward, trial_reward2

예제 #2

파일 보기

파일: kitchen_salt.py 프로젝트: praal/align

def create_init(init_locations):
    ans = []
    for j in init_locations:
        ans.append(KitchenState(j[0], j[1], (), j[0], j[1]))

    return ans