Python State.load 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: environment

클래스/타입: State

메소드/함수: load

hotexamples.com에서의 예제들: 2

Python State.load - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 environment.State.load에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

State(19)

dealercard(5)

playersum(5)

as_tuple(3)

load(2)

sample_status(2)

step(2)

agent_action(1)

deserialize_json(1)

play_with_ai(1)

play_with_human(1)

put(1)

reset(1)

예제 #1

파일 보기

파일: agent.py 프로젝트: microsoft/glider_tasklet_crawler

 def _load_task(self, task_dict, states_dir):
     task = Task(resume_utg=False, **task_dict)
     for i in range(len(task_dict["state_history"])):
         state_str = task_dict["state_history"][i]
         action_str = task_dict["action_history"][i]
         state = State.load(state_dir=states_dir, state_str=state_str)
         state.setup(task)
         action = self._load_action(state, action_str)
         task.state_history.append(state)
         task.action_history.append(action)
     task.state = State.load(state_dir=states_dir,
                             state_str=task_dict["state"])
     task.state.setup(task)
     task.reward = task_dict["reward"]
     task.total_reward = task_dict["total_reward"]
     task.done = task_dict["done"]
     return task

예제 #2

파일 보기

 def compute_reward(task, trace_lines):
     # logging.info(f"compute_reward starts at {datetime.now()}")
     states = []
     actions = []
     # browser.reset(task.start_url)
     state_action_lines = [(line[:(line.find(": "))],
                            line[(line.find(": ") + 2):])
                           for line in trace_lines]
     current_state_str, action_line = state_action_lines[0]
     current_state = State.load(states_dir, current_state_str)
     actions.append("RESET")
     states.append(current_state)
     task.reset(current_state, update_utg=False)
     last_action = load_action(current_state, action_line)
     actions.append(action_line)
     end_reached = False
     correct_rewards = [0]
     incorrect_rewards = [task.total_reward]
     for state_str, action_line in state_action_lines[1:]:
         current_state = State.load(states_dir, state_str)
         states.append(current_state)
         task.update(last_action, current_state, update_utg=False)
         if task.target_achieved:
             correct_rewards.append(task.total_reward)
         else:
             incorrect_rewards.append(task.total_reward)
         if action_line == "END":
             end_reached = True
             break
         else:
             last_action = load_action(current_state, action_line)
     max_correct_reward = max(correct_rewards)
     max_incorrect_reward = max(incorrect_rewards)
     logging.info(
         f"  task got correct reward {max_correct_reward:6.3f}"
         f" and incorrect reward {max_incorrect_reward:3.3f}: {task.name}"
     )
     return max_correct_reward, max_incorrect_reward