Python ConsumableGridWorldIRL.slidingWindowEncoding示例

编程语言: Python

命名空间/包名称: domains.ConsumableGridWorldIRL

方法/功能: slidingWindowEncoding

hotexamples.com的示例: 2

Python ConsumableGridWorldIRL.slidingWindowEncoding - 已找到2个示例。这些是从开源项目中提取的最受好评的domains.ConsumableGridWorldIRL.ConsumableGridWorldIRL.slidingWindowEncoding现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

ConsumableGridWorldIRL(8)

stateVisitEncoding(4)

allMarkovEncoding(2)

rewardIRL(2)

slidingWindowEncoding(2)

maxEntReward(1)

statePassageEncoding(1)

tRewardIRL(1)

示例#1

显示文件

文件： test.py 项目： BerkeleyAutomation/consumable-irl

def grid_world1_sliding(exp_id=3, path="./Results/gridworld1"):
    opt = {}
    opt["exp_id"] = exp_id
    opt["path"] = path
    opt["checks_per_policy"] = 10
    opt["max_steps"] = 150000
    opt["num_policy_checks"] = 20
    noise = 0.1
    exp = 0.3
    discretization = 400

    maze = os.path.join(ConsumableGridWorld.default_map_dir, '10x7-ACC2011.txt')
    domain = ConsumableGridWorldIRL([(7,5), (1,2)], 
                                    mapname=maze, 
                                    encodingFunction= lambda x: ConsumableGridWorldIRL.slidingWindowEncoding(x,3), 
                                    noise=noise)
    
    opt["domain"] = domain

    # Representation
    representation = IncrementalTabular(domain, discretization=discretization)

    # Policy
    policy = eGreedy(representation, epsilon=exp)

    # Agent
    opt["agent"] = Q_Learning(representation=representation, policy=policy,
                       discount_factor=domain.discount_factor,
                       initial_learn_rate=0.1,
                       learn_rate_decay_mode="boyan", boyan_N0=100,
                       lambda_=0.)

    experiment = Experiment(**opt)
    experiment.run(visualize_steps=False,
                   visualize_learning=False,
                   visualize_performance=0)
    experiment.save()
    return np.max(experiment.result["return"]),np.sum(experiment.result["return"])

示例#2

显示文件

文件： GridWorld.py 项目： BerkeleyAutomation/consumable-irl

 def createSlidingDomain(self,k):
     return ConsumableGridWorldIRL(self.env_template["consumable"], 
                                 mapname=self.env_template["map"], 
                                 encodingFunction= lambda x: ConsumableGridWorldIRL.slidingWindowEncoding(x,k), 
                                 noise=self.env_template["noise"])