Python Memory.clear 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: Memory

클래스/타입: Memory

메소드/함수: clear

hotexamples.com에서의 예제들: 3

Python Memory.clear - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 Memory.Memory.clear에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Memory(30)

add(14)

batch_update(7)

__init__(5)

clear(3)

fetch(3)

get_size(2)

full(2)

copy(2)

cpu(2)

add_sample(2)

clear_memory(2)

get_doublewordi(1)

get_doubleword(1)

Decrement(1)

get_discountedRewardSum(1)

get_all_sample(1)

getWriteMiss(1)

getValue(1)

getSystemMemory(1)

getSwapMemory(1)

getMisses(1)

get_binary_string(1)

get_oldest_memory(1)

get_init_state(1)

get_instruction_keys(1)

getHits(1)

get_row(1)

get_sample(1)

get_string(1)

get_val(1)

init(1)

load(1)

print_self(1)

readCallHistory(1)

readMsgHistory(1)

set_up(1)

writeCallHistory(1)

getMemoryBatch(1)

forget_oldest_memory(1)

getAverageSystemMemory(1)

append(1)

GetMinibatch(1)

GetValue(1)

Increment(1)

Init(1)

MoveLeft(1)

MoveRight(1)

RecordExperience(1)

SetCellVal(1)

예제 #1

파일 보기

파일: Cartpole_A2C.py 프로젝트: HosseinSheikhi/Cartpole

def run():
    env = gym.make('CartPole-v0')
    episode_num = 1
    episode_done = True
    a2c_agent = A2CAgent(env.action_space.n, env.observation_space.shape[0])
    memory = Memory()
    episode_reward = 1
    task_done = deque(maxlen=20)
    while True:
        if episode_done:
            state = env.reset()
            next_state = [
            ]  # next state will pass to initialize the accumulated reward
            episode_done = False
            template = 'episode num {}  ends after {} time steps'
            print(template.format(episode_num, episode_reward))
            task_done.append(episode_reward)
            episode_num += 1
            episode_reward = 0
            if sum(task_done) / len(task_done) > 195:
                print("####F*****G CONGRATULATIONS! TAKS IS DONE####")
                exit()

        for i in range(LOOKAHEAD):
            env.render()

            state = tf.convert_to_tensor(state)
            state = tf.expand_dims(state, 0)
            action = a2c_agent.act(state)
            memory.store(s=state, a=action)
            state, reward, episode_done, _ = env.step(action)
            memory.store(r=reward)
            episode_reward += reward
            next_state = state
            if episode_done:
                next_state = []  # if episode is done next state is None,
                break

        a2c_agent.prepare_train(memory, next_state)
        memory.clear()

예제 #2

파일 보기

파일: Worker.py 프로젝트: Xemnas0/assignment3_mas

    def run(self):
        total_step = 1
        mem = Memory()
        # Loop for all the episodes
        while Worker.global_episode < args.max_eps:
            current_state = self.env.reset()

            obs = current_state.clip(self.mn_d, self.mx_d)
            current_state = (((obs - self.mn_d) * (self.new_maxd - self.new_mind)
                        ) / (self.mx_d - self.mn_d)) + self.new_mind

            mem.clear()
            ep_reward = 0.
            ep_steps = 0
            self.ep_loss = 0
            time_count = 1
            total_loss = tf.constant(10e5)
            # Loop through one episode, until done or reached maximum steps per episode
            for ep_t in range(args.max_step_per_ep):
                # Take action based on current state
                mu, sigma, _ = self.local_model(
                    tf.convert_to_tensor(current_state[None, :],
                                         dtype=tf.float32))
                cov_matrix = np.diag(sigma[0])
                normal_dist = tfp.distributions.Normal(mu, tf.sqrt(sigma))
                # action = tf.clip_by_value(tf.squeeze(normal_dist.sample(1), axis=0),
                #                           clip_value_min=-0.999999,
                #                           clip_value_max=0.999999)

                action = tf.clip_by_value(mu,
                                          clip_value_min=self.env.action_space.low,
                                          clip_value_max=self.env.action_space.high)

                # Receive new state and reward
                # print(action.numpy()[0])
                new_state, reward, done_game, _ = self.env.step(action.numpy()[0])
                obs = new_state.clip(self.mn_d, self.mx_d)
                new_state = (((obs - self.mn_d) * (self.new_maxd - self.new_mind)
                                  ) / (self.mx_d - self.mn_d)) + self.new_mind

                done = True if ep_t == args.max_step_per_ep - 1 else done_game

                reward = max(min(float(reward), 1.0), -10.0)
                ep_reward += reward

                mem.store(current_state, action, reward)

                if time_count == args.update_freq or done:

                    # Calculate gradient wrt to local model. We do so by tracking the
                    # variables involved in computing the loss by using tf.GradientTape
                    with tf.GradientTape(persistent=True) as tape:
                        tape.watch(total_loss)
                        total_loss = self.compute_loss(done,
                                                       new_state,
                                                       mem,
                                                       args.gamma)

                    self.ep_loss += total_loss
                    # Calculate local gradients
                    grads = tape.gradient(total_loss, self.local_model.trainable_weights)
                    # Push local gradients to global model
                    try:
                        self.opt.apply_gradients(zip(grads,
                                                     self.global_model.trainable_weights))
                    except ValueError:
                        print("ValueError")



                    # Update local model with new weights
                    self.local_model.set_weights(self.global_model.get_weights())

                    mem.clear()
                    time_count = 0

                    if done:  # done and print information
                        Worker.global_moving_average_reward = \
                            record(Worker.global_episode, ep_reward, self.worker_idx,
                                   Worker.global_moving_average_reward, self.result_queue,
                                   self.ep_loss, ep_steps)
                        # We must use a lock to save our model and to print to prevent data races.
                        if ep_reward > Worker.best_score:
                            with Worker.save_lock:
                                print("Saving best model to {}, "
                                      "episode score: {}".format(self.save_dir, ep_reward))
                                self.global_model.save_weights(
                                    os.path.join(self.save_dir,
                                                 'model_{}.h5'.format(self.game_name))
                                )
                                Worker.best_score = ep_reward
                        Worker.global_episode += 1
                        ep_steps += 1
                        time_count += 1
                        total_step += 1
                        break
                ep_steps += 1

                time_count += 1
                current_state = new_state
                total_step += 1
        self.result_queue.put(None)

예제 #3

파일 보기

"""
from Memory import Memory
from Parser import Parser

if __name__ == '__main__':

    files = ["julia1.txt"]
    JuliaCode = "julia1.txt"
    parser = Parser(JuliaCode)
    print('Executing...----------------------------------------------------\n')
    print(format(JuliaCode))
    print('\bOutput')
    intrepret = parser.parse()
    intrepret.execute()

    Memory.clear()
    print('Test Complete.. No error')
"""
JUlIA Code Samples to Copy and Paste in Julia.txt file

Code 1

function a ( )
x = 1
while <= x 3
print ( x )
 x = + x 1
end
print ( 9999 )
end