Python QLearning.get_q_values Beispiele

Programmiersprache: Python

Namespace / Paketname: lib.reinforcement_learning.q_learning

Klasse / Typ: QLearning

Methode / Funktion: get_q_values

Beispiele auf hotexamples.com: 2

Python QLearning.get_q_values - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die lib.reinforcement_learning.q_learning.QLearning.get_q_values, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

QLearning(4)

greedy_rate(2)

episodes(1)

get_q_values(1)

learn(1)

print_experience(1)

reset(1)

train(1)

Beispiel #1

Datei anzeigen

def main():

    # ダミー変数化のため, [0, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096, 8192]
    # 入力素子数は, 16×14にされる.
    ql_obj = QLearning(16, 4, dummy=False)

    max_score = 0
    score_list = []
    for i in range(10000):

        score, result = play(ql_obj)

        # Q-learning
        ql_obj.train(result)

        score_list.append(score)

        # print weight
        data = [[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 2], [0, 0, 0, 2]]
        output_vec = ql_obj.get_q_values(data)
        print i, numpy.mean(score_list), max(score_list), output_vec

Beispiel #2

Datei anzeigen

Datei: main.py Projekt: kokukuma/reinforcement_learning_2048

def main():

    # ダミー変数化のため, [0, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096, 8192]
    # 入力素子数は, 16×14にされる.
    ql_obj =  QLearning(16, 4, dummy=False)

    max_score = 0
    score_list = []
    for i in range(10000):

        score, result = play(ql_obj)

        # Q-learning
        ql_obj.train(result)

        score_list.append(score)

        # print weight
        data =[[0,0,0,0], [0,0,0,0], [0,0,0,2], [0,0,0,2]]
        output_vec= ql_obj.get_q_values(data)
        print i, numpy.mean(score_list) , max(score_list), output_vec