Python Model.action_value примеры использования

Язык программирования: Python

Пространство имен/Пакет: Model

Класс/Тип: Model

Метод/Функция: action_value

Примеров на hotexamples.com: 2

Python Model.action_value - 2 примера найдено. Это лучшие примеры Python кода для Model.Model.action_value, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

__init__(30)

Model(30)

accuracy(13)

add(6)

join(3)

fetchOneRow(2)

Get_train_step(2)

__repr__(2)

_get_mean_shape(2)

isAlive(2)

_get_patients(2)

action_value(2)

getNextImage(1)

get_events_from_file(1)

getAll(1)

get_initial_data(1)

getAudioFileList(1)

get_filter_indices_by_clusters(1)

getCalculatorValue(1)

getHost(1)

getMapping(1)

get_file_channel_list(1)

getSaveStatus(1)

getPlayerMap(1)

exportCSV(1)

fetchAllRows(1)

getProjectFilePath(1)

generatePrediction(1)

getMappingNotLinear(1)

get_master_channel_list(1)

getPrevImage(1)

getPort(1)

AI_move(1)

get_uv(1)

get_norm(1)

pretraining_functions(1)

updateModel(1)

symmetric(1)

set_all_data(1)

setProjectFilePath(1)

setCordinate(1)

save_labels_log(1)

save_labels(1)

save_channel_dict(1)

reprocess_fft(1)

registerContact(1)

process_business_logic(1)

printModel(1)

pobierz_makiete(1)

get_subsample_indices(1)

Пример #1

Показать файл

from tensorflow.keras import callbacks
# import xdot

EPOCHS = 20
EPISODES = 50
BOARDSIZE = 9
LEARNINGRATE = 0.0002
MAXTURNS = (BOARDSIZE * BOARDSIZE) - BOARDSIZE
# logdir= "testlog"
# tensorboard_callback = callbacks.TensorBoard(logdir, histogram_freq=1)
# callbacks = [tensorboard_callback]
callbacks = None

env = GoGame(BOARDSIZE, maxTurns=MAXTURNS)
model = Model(num_actions=env.action_space.n, callbacks=callbacks)
model.action_value(env.reset()[None, :])  #build the model
model.summary()
agent = A2CAgent(model, lr=LEARNINGRATE)
for epoch in range(EPOCHS):
    # gc.collect()
    backend.clear_session()
    # objgraph.show_growth()
    # print("--------------------------------")
    time_start = time.time()
    rewards_history, episode_wins, losses = agent.train(env,
                                                        max_steps=MAXTURNS,
                                                        episodes=EPISODES,
                                                        info=False,
                                                        info_step=50)
    print(
        "epoch = {:2} | won {:3}/{:3} matches | mean rewards = {:7.2f} | mean losses = {:7.2f} | epoch time = {:6.2f} sec"

Пример #2

Показать файл

@app.route('/background_process_test')
def background_process_test():
    global AI_TURN
    if(AI_TURN):
        AI_TURN = False
        flat_board = get_flat_board()
        action, _ = model.action_value(np.asarray(flat_board)[None, :])
        coord = env.flatMoveToCoord(int(action))
        if (flat_board[int(action)] == 0):
            stone = driver.find_element_by_css_selector("#board5 > div.row > div > div:nth-child({}) > div:nth-child({})".format(coord[0]+1,coord[1]+1))
            stone.click()
            print ("put stone on ({},{})".format(coord[0],coord[1]))
        else:
            print("invalid move ({},{}) passing instead".format(coord[0],coord[1]))
            pass_move = driver.find_element_by_css_selector("#board5 > div.goPlayers > div.stats.white > div.pass")
            pass_move.click()
        return "Nothing"
    else:
        AI_TURN = True
        return "Nothing"


if __name__ == "__main__":
    env = GoGame(5, maxTurns=50)
    model = Model(num_actions=env.action_space.n)
    model.action_value(env.reset()[None, :])
    model.load_weights(MODEL_NAME)
    driver = webdriver.Chrome("C:\\Users\\flori\\Desktop\\q_learning\\go_game\\chromedriver.exe")
    driver.get("http://127.0.0.1:5000")
    app.run()