Python MultiArmedBandit.expected_performance示例

编程语言: Python

命名空间/包名称: environments

类/类型: MultiArmedBandit

方法/功能: expected_performance

hotexamples.com的示例: 2

Python MultiArmedBandit.expected_performance - 已找到2个示例。这些是从开源项目中提取的最受好评的environments.MultiArmedBandit.expected_performance现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

MultiArmedBandit(3)

expected_performance(1)

get_hidden_states(1)

示例#1

显示文件

文件： rmodels.py 项目： satpreetsingh/pyBefit

    def expected_performance(x):
        """Example of how the expected performance can be computed."""
        pm_pars = {'alpha': x[0], 'beta': x[1]}
        rm_pars = {'theta': x[2]}

        T = 100  #number of trials
        n_b = 2  #number of bandits
        rho = 0.01  #switch probability of the arm-reward contingencies

        n_env = 100  #number of environments
        n_blocks = 1  #number of experimental blocks
        ep = 0  # expected performance

        for n in range(n_env):
            #generate n_env mutli-armed bandit environmets
            env = MultiArmedBandit(T, rho=rho, n_b=n_b)
            pm = RescorlaWagner(env, n_b)
            for m in range(n_blocks):
                #in each environment repeat the experiment n_blocks times
                rm = SoftMaxResponses([], pm, d_r)
                rm.get_responses(pm_pars, rm_pars)
                #For each block compute the expected performance.
                ep += env.expected_performance()

        return ep / (n_env * n_blocks)

示例#2

显示文件

文件： rmodels.py 项目： dimarkov/pyBefit

 def expected_performance(x):
     """Example of how the expected performance can be computed."""
     pm_pars = {'alpha': x[0], 'beta': x[1]}
     rm_pars = {'theta': x[2]}
     
     T = 100 #number of trials
     n_b = 2 #number of bandits
     rho = 0.01 #switch probability of the arm-reward contingencies
     
     n_env = 100 #number of environments
     n_blocks = 1 #number of experimental blocks
     ep = 0 # expected performance
     
     for n in range(n_env):
         #generate n_env mutli-armed bandit environmets
         env = MultiArmedBandit(T, rho = rho, n_b = n_b)
         pm = RescorlaWagner(env, n_b)
         for m in range(n_blocks):
             #in each environment repeat the experiment n_blocks times
             rm = SoftMaxResponses([], pm, d_r)
             rm.get_responses(pm_pars, rm_pars)
             #For each block compute the expected performance.
             ep += env.expected_performance()
     
     return ep/(n_env*n_blocks)