Python MultiSyncEnvRunner.run 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: ai_traineree.env_runner

클래스/타입: MultiSyncEnvRunner

메소드/함수: run

hotexamples.com에서의 예제들: 6

Python MultiSyncEnvRunner.run - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 ai_traineree.env_runner.MultiSyncEnvRunner.run에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

MultiSyncEnvRunner(15)

run(6)

logger(3)

info(2)

load_state(2)

log_data_interaction(2)

log_episode_metrics(2)

episode(1)

reset(1)

save_state(1)

예제 #1

0

파일 보기

파일: test_env_runner.py 프로젝트: laszukdawid/ai-traineree

def test_multi_sync_env_runner_save_state(mock_json, mock_path):
    # Assign
    test_agent.save_state = mock.MagicMock()
    env_runner = MultiSyncEnvRunner([test_task], test_agent)

    # Act
    env_runner.run(max_episodes=10, max_iterations=10)
    with mock.patch('builtins.open'):
        env_runner.save_state('saved_state.state')

    # Assert
    test_agent.save_state.assert_called_once()
    state = mock_json.dump.call_args[0][0]
    assert state['episode'] == 10
    assert state['tot_iterations'] == 10 * 10

예제 #2

0

파일 보기

파일: test_env_runner.py 프로젝트: laszukdawid/ai-traineree

def test_multi_sync_env_runner_log_data_interaction_log_after_episode(
        mock_data_logger):
    # Assign
    test_agent.log_metrics = mock.MagicMock()
    env_runner = MultiSyncEnvRunner([test_task],
                                    test_agent,
                                    data_logger=mock_data_logger)

    # Act
    env_runner.run(max_episodes=1, max_iterations=10)

    # Assert
    test_agent.log_metrics.assert_called_once_with(mock_data_logger,
                                                   10,
                                                   full_log=False)
    assert mock_data_logger.log_values_dict.call_count == 0
    assert mock_data_logger.log_value.call_count == 4

예제 #3

0

파일 보기

파일: test_env_runner.py 프로젝트: laszukdawid/ai-traineree

def test_multi_sync_env_runner_run_single_step_single_task():
    # Assign
    multi_sync_env_runner = MultiSyncEnvRunner([test_task], test_agent)

    # Act
    scores = multi_sync_env_runner.run(max_episodes=1,
                                       max_iterations=1,
                                       force_new=True)

    # Assert
    assert len(
        scores) == 1  # No chance that it'll terminate episode in 1 iteration

예제 #4

0

파일 보기

파일: test_env_runner.py 프로젝트: laszukdawid/ai-traineree

def test_multi_sync_env_runner_run_single_step_multiple_task():
    # Assign
    tasks: List[TaskType] = [test_task, test_task]
    agent = PPOAgent(test_task.state_size,
                     test_task.action_size,
                     num_workers=len(tasks))
    multi_sync_env_runner = MultiSyncEnvRunner(tasks, agent)

    # Act
    scores = multi_sync_env_runner.run(max_episodes=1,
                                       max_iterations=1,
                                       force_new=True)

    # Assert
    assert len(
        scores) == 2  # After 1 iteration both "finished" at the same time

예제 #5

0

파일 보기

파일: test_env_runner.py 프로젝트: laszukdawid/ai-traineree

def test_multi_sync_env_runner_run_multiple_step_multiple_task():
    # Assign
    tasks: List[TaskType] = [test_task, test_task]
    agent = PPOAgent(test_task.state_size,
                     test_task.action_size,
                     num_workers=len(tasks))
    multi_sync_env_runner = MultiSyncEnvRunner(tasks, agent)

    # Act
    scores = multi_sync_env_runner.run(max_episodes=3,
                                       max_iterations=100,
                                       force_new=True)

    # Assert
    assert len(scores) in (
        3, 4
    )  # On rare occasions two tasks can complete twice at the same time.

예제 #6

0

파일 보기

파일: lunar_lander_ppo_multi.py 프로젝트: laszukdawid/ai-traineree

    "using_kl_div": True,
    # "value_loss_weight": 2,
    "entropy_weight": 0.01,
    "gamma": 0.999,
    'lambda_gae': 0.98,
    "critic_lr": 3e-4,
    "actor_lr": 3e-4,
    "action_scale": 1,
    "action_min": -20,
    "action_max": 20,
}
tasks: List[TaskType] = [GymTask(env_name) for _ in range(num_workers)]
agent = Agent(tasks[0].state_size,
              tasks[0].action_size,
              hidden_layers=(100, 64, 64),
              **kwargs)
env_runner = MultiSyncEnvRunner(tasks,
                                agent,
                                processes=processes,
                                data_logger=data_logger)
scores = env_runner.run(reward_goal=80, max_episodes=5000, force_new=True)

# plot the scores
fig = plt.figure()
ax = fig.add_subplot(111)
plt.plot(range(len(scores)), scores)
plt.ylabel('Score')
plt.xlabel('Episode #')
plt.savefig(f'{env_name}.png', dpi=120)
plt.show()