Python sample_prob_dictの例

プログラミング言語: Python

名前空間/パッケージ名: pyrlap.core.util

メソッド/関数: sample_prob_dict

hotexamples.comのコード掲載数: 10

Python sample_prob_dict - 10件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのpyrlap.core.util.sample_prob_dictの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

 def reward(self, s=None, a=None, ns=None):
     t_dist = self.transition_reward_dist(s, a)
     r_dist = {}
     for (ns_, r), p in t_dist.items():
         if ns_ == ns:
             r_dist[r] = r_dist.get(r, 0) + p
     return sample_prob_dict(r_dist)

コード例 #2

ファイルを表示

    def act(self, s, softmax_temp=None, randchoose=None):
        actions = self.ham.available_actions(s)
        a_q = {}
        for a in actions:
            q = self._qval(s, a)
            # if q == -np.inf: #never take actions that machine loop
            #     continue
            a_q[a] = q

        if softmax_temp is None:
            softmax_temp = self.softmax_temp
        if randchoose is None:
            randchoose = self.randchoose

        adist = calc_esoftmax_dist(a_q,
                                   temp=softmax_temp,
                                   randchoose=randchoose)
        return sample_prob_dict(adist)

コード例 #3

ファイルを表示

 def transition(self, s, a):
     return sample_prob_dict(self.transition_reward_dist(s, a))[0]

コード例 #4

ファイルを表示

 def reward(self, s=None, a=None, ns=None):
     return sample_prob_dict(self.reward_dist(s, a, ns))

コード例 #5

ファイルを表示

 def observation(self, a: Action, ns: State) -> Observation:
     return sample_prob_dict(self.observation_dist(a, ns))

コード例 #6

ファイルを表示

 def get_init_state(self):
     return sample_prob_dict(self.get_init_state_dist())

コード例 #7

ファイルを表示

 def act(self, s, softmax_temp=None, randchoose=None):
     adist = self.act_dist(s, softmax_temp, randchoose)
     return sample_prob_dict(adist)

コード例 #8

ファイルを表示

 def transition_reward(self, s=None, a=None):
     return sample_prob_dict(self.transition_reward_dist(s, a))

コード例 #9

ファイルを表示

 def get_init_state(self):
     if len(self.init_state_dist) == 0:
         raise ValueError("No initial state defined")
     return sample_prob_dict(self.init_state_dist)

コード例 #10

ファイルを表示

 def transition(self,
                s: "state",
                ja: "joint action"):
     return sample_prob_dict(self.transition_reward_dist(s, ja))[0]