Python SumoEnvironment.save_csvの例

プログラミング言語: Python

名前空間/パッケージ名: sumo_rl.environment.env

クラス/型: SumoEnvironment

メソッド/関数: save_csv

hotexamples.comのコード掲載数: 2

Python SumoEnvironment.save_csv - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのsumo_rl.environment.env.SumoEnvironment.save_csvの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

SumoEnvironment(10)

encode(4)

step(4)

radix_decode(3)

radix_encode(2)

reset(2)

save_csv(2)

_compute_rewards(1)

add_plot(1)

close(1)

join(1)

set_agent(1)

コード例 #1

ファイルを表示

ファイル: sarsa_2way-single-intersection.py プロジェクト: fancyerii/sumo-rl

    agent = TrueOnlineSarsaLambda(env.observation_space,
                                  env.action_space,
                                  alpha=args.alpha,
                                  gamma=args.gamma,
                                  epsilon=args.epsilon,
                                  lamb=args.lamb)
    for run in range(1, args.runs + 1):
        obs = env.reset()
        agent.reset()

        done = False
        if args.fixed:
            while not done:
                _, _, done, _ = env.step({})
        else:
            while not done:
                action = agent.act(agent.get_features(obs))

                next_obs, r, done, _ = env.step(action=action)

                agent.learn(state=obs,
                            action=action,
                            reward=r,
                            next_state=next_obs)

                obs = next_obs

        env.save_csv(out_csv, run)
        env.close()

コード例 #2

ファイルを表示

ファイル: ql_2way-single-intersection.py プロジェクト: wenliyuan/sumo-rl

        initial_states = env.reset()
        ql_agents = {ts: QLAgent(starting_state=env.encode(initial_states[ts]),
                                 state_space=env.observation_space,
                                 action_space=env.action_space,
                                 alpha=args.alpha,
                                 gamma=args.gamma,
                                 exploration_strategy=EpsilonGreedy(initial_epsilon=args.epsilon, min_epsilon=args.min_epsilon, decay=args.decay)) for ts in env.ts_ids}

        done = {'__all__': False}
        infos = []
        if args.fixed:
            while not done['__all__']:
                _, _, done, _ = env.step({})
        else:
            while not done['__all__']:
                actions = {ts: ql_agents[ts].act() for ts in ql_agents.keys()}

                s, r, done, _ = env.step(actions=actions)

                if args.v:
                    print('s=', env.radix_decode(ql_agents['t'].state), 'a=', actions['t'], 's\'=', env.radix_encode(s['t']), 'r=', r['t'])

                for agent_id in ql_agents.keys():
                    ql_agents[agent_id].learn(new_state=env.encode(s[agent_id]), reward=r[agent_id])
        env.save_csv()
        env.close()