Python Maze.GetState Beispiele

Programmiersprache: Python

Namespace / Paketname: Maze

Klasse / Typ: Maze

Methode / Funktion: GetState

Beispiele auf hotexamples.com: 1

Python Maze.GetState - 1 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die Maze.Maze.GetState, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Maze(30)

show(2)

getRandomOrigin(2)

getRandomUnvisitedNeightbour(2)

GetBorders(2)

getRaw(2)

addEntryAndExitPoints(2)

hasUnvisitedNeightbours(2)

__init__(2)

markVisitedCell(2)

SetRewardAndNextStateDict(2)

SetDimensions(2)

removeWallBettweCells(2)

getJSON(2)

hasUnvisitedCells(1)

get_exit_point(1)

print_maze(1)

rank_colors(1)

read(1)

getRandomUnvisitedCellr(1)

DrawOnScreen(1)

generate(1)

gen_map(1)

addRoom(1)

add(1)

aStar(1)

aSolve(1)

SetWay(1)

LoadFromTextFile(1)

HasPath(1)

GetVertex(1)

GetState(1)

cells(1)

Beispiel #1

Datei anzeigen

Datei: Train.py Projekt: THU-Yu/Rat-Walking-Maze-RL-QLearning-

mazeTraining = Maze(maze)
mazeTraining.SetRewardAndNextStateDict()
agentTraining = Agent(maze)
preTrain = input("是否使用预训练模型？（y/n）:")
if preTrain == 'y':
    agentFileName = input("请输入智能体的预训练模型文件名：")
    agentTraining.qTable = np.load(agentFileName)
trainingTime = int(input("请输入训练次数："))
epsilon = 1
learningRate = 0.5
gamma = 1
for i in range(trainingTime):
    epsilon -= 1 / (trainingTime // 2)  # epsilon递减
    # 随机初始化训练起点
    state = np.random.randint(agentTraining.stateNum)
    while mazeTraining.GetState(state) != 1:
        state = np.random.randint(agentTraining.stateNum)
    time = 0
    while mazeTraining.GetState(state) != 0.9:
        # epsilon贪心策略
        if False not in (agentTraining.qTable[:, state] == [0, 0, 0, 0]):
            action = np.random.randint(4)
        else:
            if random.random() < epsilon:
                action = np.random.randint(4)
            else:
                action = np.argmax(agentTraining.qTable[:, state])
        nextState = agentTraining.GetNextState(state, action)
        # 更新Q表
        agentTraining.qTable[action,state] =(1 - learningRate) * agentTraining.qTable[action,state] +\
            learningRate * (agentTraining.maze.reward[action,state] + gamma * np.amax(agentTraining.qTable[:,nextState]))