Python Memory.add_to_memory 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: memory

클래스/타입: Memory

메소드/함수: add_to_memory

hotexamples.com에서의 예제들: 2

Python Memory.add_to_memory - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 memory.Memory.add_to_memory에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Memory(30)

add(30)

append(16)

batch_update(10)

clear(9)

__init__(8)

clear_stmemory(5)

clear_memory(4)

addMemory(4)

add_single(3)

ai_features(3)

add_sample(3)

newLocalMemory(2)

append_memory(2)

getIP(2)

freeLocalMemory(2)

allocate(2)

alloc(2)

forget(2)

addprocess(2)

load_cartridge(2)

add_to_memory(2)

deleteFile(2)

choosepagevm(2)

awakeLocalMemory(2)

defragment(2)

addReminder(2)

test(2)

sleepLocalMemory(2)

setLocalMemory(2)

setGlobalMemory(2)

addIP(2)

tofile(1)

symbol(1)

get_int_value(1)

setupIO(1)

writeMemory(1)

get_float_value(1)

get_byte(1)

get_bool_value(1)

getLastMemory(1)

getByte(1)

dump_db(1)

use_memory(1)

getArea(1)

get_pointer_value(1)

disasm(1)

symbolXML(1)

syscall(1)

end_memorizing(1)

예제 #1

파일 보기

파일: main.py 프로젝트: mMcaniff/MyGo

def play_matches(player1, player2, games):
    game = board.GoBoard()
    currentGameCount = 0

    scores = {"player1": 0, "player2": 0}

    switchTurn = {-1: 1, 1: -1}

    main_memory = Memory()

    while currentGameCount < games:
        game = board.GoBoard()
        rand = random.randint(0, 1) * 2 - 1
        if rand == -1:
            playerTurn = -1
            players = {
                1: {
                    "agent": player1,
                    "name": "Player 1"
                },
                -1: {
                    "agent": player2,
                    "name": "Player 2"
                }
            }
        else:
            playerTurn = 1
            players = {
                1: {
                    "agent": player2,
                    "name": "Player 2"
                },
                -1: {
                    "agent": player1,
                    "name": "Player1"
                }
            }

        game_running = 0
        turn = 0

        while game_running == 0:
            memory_1 = Memory()
            memory_2 = Memory()

            turn += 1

            # Make an action
            #action ,pi, mcts_values, nn_value = players[playerTurn]["agent"].mcts.act()
            new_state, value, preds = players[playerTurn]["agent"].act()
            print(playerTurn)
            print(players[playerTurn])
            print("Value: " + str(value))
            print(new_state.state)

            if playerTurn == -1:
                memory_1.add_to_memory(new_state.state)
            else:
                memory_2.add_to_memory(new_state.state)

            # Switch the current player
            playerTurn = switchTurn[playerTurn]

            # Update the new current players game state
            players[playerTurn]["agent"].oppAct(new_state)

            if new_state.state.is_game_over():
                print("Game " + str(currentGameCount) + " is over!")
                winner = new_state.state.get_winner()

                print(winner + " Won!")
                if winner == "Player 1":
                    memory_1.declare_win_or_loss(1)
                    memory_2.declare_win_or_loss(-1)
                else:
                    memory_2.declare_win_or_loss(1)
                    memory_1.declare_win_or_loss(-1)

                main_memory.join_memories(memory_1)
                main_memory.join_memories(memory_2)

                game_running = 1

        currentGameCount += 1

예제 #2

파일 보기

env = gym.make("CartPole-v0")
env.seed(1)
n_actions = env.action_space.n
cartpole_model = create_cartpole_model()
memory = Memory()
learning_rate = 1e-3
optimizer = tf.train.AdamOptimizer(learning_rate)
smoothed_reward = util.LossHistory(smoothing_factor=0.9)
plotter = util.PeriodicPlotter(sec=5, xlabel='Iterations', ylabel='Rewards')

for i_episode in range(10000):
    plotter.plot(smoothed_reward.get())
    observation = env.reset()
    while True:
        action = choose_action(cartpole_model, observation)
        next_obs, reward, done, info = env.step(action)
        memory.add_to_memory(observation, action, reward)
        if done:
            total_reward = sum(memory.rewards)
            smoothed_reward.append(total_reward)
            train_step(cartpole_model,
                       optimizer,
                       observations=np.vstack(memory.observations),
                       actions=np.array(memory.actions),
                       discounted_rewards=discount_rewards(memory.rewards))
            memory.clear()
            break
        observation = next_obs

save_video_of_model(cartpole_model, "CartPole-v0")