Python all_argmaxの例

プログラミング言語: Python

名前空間/パッケージ名: pybrain.utilities

メソッド/関数: all_argmax

hotexamples.comのコード掲載数: 4

Python all_argmax - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのpybrain.utilities.all_argmaxの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

def greedyQPolicy(Qs):
    """ Find the greedy deterministic policy, 
    given the Q-values. """
    dim = len(Qs)
    numA = len(Qs[0])
    policy = zeros((dim, numA))
    for si in range(dim):
        actions = all_argmax(Qs[si])
        for a in actions:
            policy[si, a] = 1. / len(actions)
    return policy

コード例 #2

ファイルを表示

ファイル: policyiteration.py プロジェクト: Angeliqe/pybrain

def greedyQPolicy(Qs):
    """ Find the greedy deterministic policy, 
    given the Q-values. """
    dim = len(Qs)
    numA = len(Qs[0])
    policy = zeros((dim, numA))
    for si in range(dim):
        actions = all_argmax(Qs[si])
        for a in actions:
            policy[si, a] = 1. / len(actions)    
    return policy

コード例 #3

ファイルを表示

def greedyPolicy(Ts, R, discountFactor, V):
    """ Find the greedy policy, (soft tie-breaking)
    given a value function and full transition model. """
    dim = len(V)
    numA = len(Ts)
    Vnext = V * discountFactor + R
    policy = zeros((dim, numA))
    for si in range(dim):
        actions = all_argmax([dot(T[si, :], Vnext) for T in Ts])
        for a in actions:
            policy[si, a] = 1. / len(actions)
    return policy, collapsedTransitions(Ts, policy)

コード例 #4

ファイルを表示

ファイル: policyiteration.py プロジェクト: Angeliqe/pybrain

def greedyPolicy(Ts, R, discountFactor, V):
    """ Find the greedy policy, (soft tie-breaking)
    given a value function and full transition model. """
    dim = len(V)
    numA = len(Ts)
    Vnext = V*discountFactor+R
    policy = zeros((dim, numA))
    for si in range(dim):
        actions = all_argmax([dot(T[si, :], Vnext) for T in Ts])
        for a in actions:
            policy[si, a] = 1. / len(actions)        
    return policy, collapsedTransitions(Ts, policy)