Esempi in Python per SAf.items

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: utils.standard_typevars

Classe/tipologia: SAf

Metodo/funzione: items

Esempi su hotexamples.com: 5

SAf.items in Python: 5 esempi trovati. Questi sono i migliori esempi reali in Python per utils.standard_typevars.SAf.items, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

items(5)

Metodi utilizzati di frequente

items (5)

Esempio n. 1

Mostra file

File: helper_funcs.py Progetto: AlexaYuqinD/MSE346

def get_soft_policy_from_qf_dict(qf_dict: SAf, softmax: bool,
                                 epsilon: float) -> Policy:
    if softmax:
        ret = Policy(
            {s: get_softmax_action_probs(v)
             for s, v in qf_dict.items()})
    else:
        ret = Policy({
            s: get_epsilon_action_probs(v, epsilon)
            for s, v in qf_dict.items()
        })
    return ret

Esempio n. 2

Mostra file

File: helper_funcs.py Progetto: AlexaYuqinD/MSE346

def get_vf_dict_from_qf_dict_and_policy(qf_dict: SAf,
                                        pol: Policy) -> Mapping[A, float]:
    return {
        s:
        sum(pol.get_state_action_probability(s, a) * q for a, q in v.items())
        for s, v in qf_dict.items()
    }

Esempio n. 3

Mostra file

File: mp_funcs.py Progetto: AlexaYuqinD/MSE346

def mdp_rep_to_mrp_rep2(
    mdp_rep: SAf,
    policy_rep: SAf
) -> Mapping[S, float]:
    return {s: sum(p * v[a] for a, p in policy_rep[s].items())
            for s, v in mdp_rep.items()}

Esempio n. 4

Mostra file

File: helper_funcs.py Progetto: AlexaYuqinD/MSE346

def get_det_policy_from_qf_dict(qf_dict: SAf) -> DetPolicy:
    return DetPolicy(
        {s: max(v.items(), key=itemgetter(1))[0]
         for s, v in qf_dict.items()})

Esempio n. 5

Mostra file

File: mp_funcs.py Progetto: AlexaYuqinD/MSE346

def verify_policy(policy_data: SAf) -> bool:
    return all(is_approx_eq(sum(v.values()), 1.0) for s, v in policy_data.items())