Esempi in Python per DataSaver.append

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: src.envs.ec.data_processor

Classe/tipologia: DataSaver

Metodo/funzione: append

Esempi su hotexamples.com: 2

DataSaver.append in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per src.envs.ec.data_processor.DataSaver.append, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

DataSaver(6)

add_item(6)

to_file(6)

append(2)

Metodi utilizzati di frequente

DataSaver (6)

add_item (6)

to_file (6)

append (2)

Esempio n. 1

Mostra file

File: q_learning.py Progetto: zongwangZ/src

def test(times):
    data_saver = DataSaver("qlearning_test")
    data_saver.add_item("start_time", time.strftime("%Y-%m-%d_%H-%M-%S"))
    from src.envs.ec.ec_env import ECMA
    env = ECMA()
    RL = QLearningTable()
    data_saver.add_item("qlearning_param",RL.param)
    data_saver.add_item("episodes",times)
    for episode in range(0, times):
        env.reset()
        observation = env.get_obs()
        observation = list(np.round(np.array(observation,dtype=float).flatten(), 3))
        while True:
            action = RL.choose_action(str(observation))
            refined_action = RL.refine_action(action)
            reward, done ,_ = env.step(refined_action)
            observation_ = env.get_obs()
            observation_ = list(np.round(np.array(observation_,dtype=float).flatten(), 3))
            observation = copy.deepcopy(observation_)
            data_saver.append(str(episode),[observation,refined_action,reward])
            if done:
                if episode / 1000 > 0:
                    print(episode, time.strftime("%Y-%m-%d_%H-%M-%S"))
                break
    data_saver.add_item("end_time", time.strftime("%Y-%m-%d_%H-%M-%S"))
    data_saver.to_file()

Esempio n. 2

Mostra file

File: q_learning.py Progetto: zongwangZ/src

def train(times=10000):
    data_saver = DataSaver("qlearning_training")
    data_saver.add_item("start_time", time.strftime("%Y-%m-%d_%H-%M-%S"))
    #创建环境
    env = create_env()
    RL = QLearningTable()
    data_saver.add_item("RL_param",RL.param)
    data_saver.add_item("episodes",times)
    for episode in range(0, times):
        env.reset()
        observation = env.get_obs()
        observation = list(np.round(np.array(observation,dtype=float).flatten(), 3))
        while True:
            action = RL.choose_action(str(observation))
            refined_action = RL.refine_action(action)
            reward, done ,_ = env.step(refined_action)
            observation_ = env.get_obs()
            observation_ = list(np.round(np.array(observation_,dtype=float).flatten(), 3))
            RL.learn(str(observation), action, reward, str(observation_),done)
            observation = copy.deepcopy(observation_)
            data_saver.append(str(episode),[observation,refined_action,reward])
            if done:
                if episode / 1000 > 0:
                    print(episode, time.strftime("%Y-%m-%d_%H-%M-%S"))
                if episode / 10000:
                    RL.save_model()
                break
    data_saver.add_item("end_time", time.strftime("%Y-%m-%d_%H-%M-%S"))
    data_saver.to_file()