Python RolloutWorker.foreach_env示例

编程语言: Python

命名空间/包名称: ray.rllib.evaluation

类/类型: RolloutWorker

方法/功能: foreach_env

hotexamples.com的示例: 4

Python RolloutWorker.foreach_env - 已找到4个示例。这些是从开源项目中提取的最受好评的ray.rllib.evaluation.RolloutWorker.foreach_env现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

foreach_env(4)

RolloutWorker(2)

sample(2)

as_remote(1)

avg_br_reward_deque(1)

br_player(1)

metanash_policy_specs(1)

metanash_weights(1)

opponent_policy_distribution(1)

p2sro_manager(1)

restore(1)

示例#1

显示文件

文件： general_nxdo_nfsp_metanash.py 项目： indylab/nxdo

 def _set_worker_converters(worker: RolloutWorker):
     worker_delegate_policy = worker.policy_map["delegate_policy"]
     player_converters = []
     for p in range(2):
         player_converter = RestrictedToBaseGameActionSpaceConverter(
             delegate_policy=worker_delegate_policy, policy_specs=player_to_base_game_action_specs[p],
             load_policy_spec_fn=create_get_pure_strat_cached(cache=weights_cache))
         player_converters.append(player_converter)
         worker.foreach_env(lambda env: env.set_action_conversion(p, player_converter))
     worker_delegate_policy.player_converters = player_converters

示例#2

显示文件

文件： general_nxdo_br.py 项目： indylab/nxdo

    def _set_conversions(worker: RolloutWorker):

        def _set_restricted_env_convertions(restricted_env):
            assert isinstance(restricted_env, RestrictedGame)
            for agent_id, action_policy_specs in agent_id_to_restricted_game_specs.items():
                if len(action_policy_specs) > 0:
                    convertor = RestrictedToBaseGameActionSpaceConverter(
                        delegate_policy=worker.policy_map[delegate_policy_id],
                        policy_specs=action_policy_specs,
                        load_policy_spec_fn=load_policy_spec_fn)
                    restricted_env.set_action_conversion(agent_id=agent_id, converter=convertor)

        worker.foreach_env(_set_restricted_env_convertions)

示例#3

显示文件

文件： general_nxdo_br.py 项目： indylab/nxdo

 def _set_worker_converters(worker: RolloutWorker):
     worker_delegate_policy = worker.policy_map[delegate_policy_id]
     for p, player_converter in player_converters.items():
         worker.foreach_env(lambda env: env.set_obs_conversion_dict(p, player_converter))
     worker_delegate_policy.player_converters = player_converters

示例#4

显示文件

文件： general_nxdo_nfsp_metanash.py 项目： indylab/nxdo

 def _set_worker_converters(worker: RolloutWorker):
     worker_delegate_policy = worker.policy_map["delegate_policy"]
     for p in range(2):
         worker.foreach_env(lambda env: env.set_obs_conversion_dict(p, player_converters[p]))
     worker_delegate_policy.player_converters = player_converters