Python Agent.Q примеры использования

Язык программирования: Python

Пространство имен/Пакет: Agent

Класс/Тип: Agent

Метод/Функция: Q

Примеров на hotexamples.com: 1

Python Agent.Q - 1 пример найден. Это лучшие примеры Python кода для Agent.Agent.Q, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

__init__(30)

act(30)

Agent(30)

Solve(15)

Walk(4)

averagePathLength(3)

TargetPotentialForce(3)

start(2)

pluckTillConnected(2)

infiniteRadium(2)

Prod(2)

Perceive(2)

decide(2)

randomRangeRadiumUnif(2)

SwarmPotentialForce(2)

GetNextState(2)

Util(2)

DoNothing(2)

Clean(2)

groupSize(2)

edgeOccupation(1)

draw(1)

constRadium(1)

isConnected(1)

getRandomVertexPair(1)

getState(1)

make_typo_mistake(1)

pluck(1)

pluckEdge(1)

print_params(1)

randomRangeRadiumNormal(1)

recover(1)

removeEdge(1)

setChannel(1)

setName(1)

setState(1)

set_continuum(1)

changeURL(1)

ASTAR(1)

addEdge(1)

MoveRight(1)

BFS(1)

DQNepisode(1)

ExecuteMovement(1)

GetActions(1)

GetLocationX(1)

GetLocationY(1)

MoveDown(1)

MoveLeft(1)

MoveRandom(1)

Пример #1

Показать файл

Файл: experiment2.py Проект: tamassimon/q-learning

def agent_loop(dictionary, lock1, lock2):
    random.seed()
    environment = GridWorldModel()
    agent = Agent(environment)
    agent.Q = dictionary[Q_SHARED_KEY]  # initialize with shared Q

    while environment.step_count < MAX_STEPS_PER_AGENT:
        environment.reset()
        agent.state = environment.get_start_state()
        while True:
            agent.act()
            if environment.step_count % ASYNC_UPDATE_INTERVAL == 0 or environment.is_terminal_state(
            ):
                lock1.acquire()
                q = dictionary[Q_SHARED_KEY]
                # Need to write it back, otherwise the proxy won't pick up the changes.
                dictionary[Q_SHARED_KEY] = np.add(q, agent.dQ)
                lock1.release()
                agent.dQ = np.zeros((GridWorldModel.get_number_of_states(),
                                     GridWorldModel.get_number_of_actions()),
                                    dtype=float)
            if environment.is_terminal_state():
                break

    lock2.acquire()
    combined_rewards = dictionary[REWARDS_KEY]
    agents_rewards = np.array(agent.rewards)
    # ...same here
    dictionary[REWARDS_KEY] = np.add(combined_rewards,
                                     agents_rewards[:MAX_STEPS_PER_AGENT])
    lock2.release()