Python Controller.get_action_space示例

编程语言: Python

命名空间/包名称: controller.Controller

类/类型: Controller

方法/功能: get_action_space

hotexamples.com的示例: 4

Python Controller.get_action_space - 已找到4个示例。这些是从开源项目中提取的最受好评的controller.Controller.Controller.get_action_space现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Controller(30)

parse_file(9)

get_func_arguments(8)

recreate_tables(5)

make_choice(4)

get_action_space(4)

run(2)

addControllableSpace(2)

clickAt(2)

query_ip(1)

preset_options(1)

mainloop(1)

load(1)

listar_clientes(1)

import_position(1)

import_data(1)

handle_decoding(1)

getTopText(1)

__init__(1)

getCurrentCellContent(1)

getControllablePopulation(1)

getAll(1)

export_data(1)

exit_program(1)

create_tables(1)

considering_choice(1)

agregar_mueble(1)

agregar_cliente(1)

add_api_key(1)

_guess(1)

saveData(1)

示例#1

显示文件

def start_workers(num_agents: int = 1,
                  env_name: str = '',
                  state_builder: StateBuilder = None,
                  num_epochs: int = 2001,
                  update_frequency: int = 10):

    State.num_agents = num_agents

    for agent in range(num_agents):
        controller = Controller(learner=None,
                                env_id=env_name,
                                state_builder=state_builder,
                                update_freq=update_frequency,
                                id=agent)

        learner = QLearner(controller.get_action_space(),
                           epsilon=0.1,
                           init_alpha=.5,
                           gamma=.9,
                           decay_rate=.999)

        controller.set_learner(learner)

        agent_thread = threading.Thread(target=controller.train,
                                        kwargs={
                                            "number_epochs":
                                            num_epochs,
                                            "save_location":
                                            '../models/{}-{}.model'.format(
                                                env_name, agent)
                                        })
        agent_thread.start()

    return

示例#2

显示文件

def main():
    # Taxi-v2
    cart_pole_ctrl = Controller(None,
                                'CartPole-v1',
                                StateBuilderCartPole(),
                                communicate=False)
    # cart_pole_ctrl = Controller(None, 'Taxi-v2', None, communicate=False)
    # cart_pole_ctrl = Controller(None, 'LunarLander-v2', state_builder=StateBuilderLunarLander(), communicate=False)
    # cart_pole_ctrl = Controller(None, 'FrozenLake-v0', None, communicate=False)

    running_cumulative_reward = []
    for _ in range(3):
        learner = QLearner(cart_pole_ctrl.get_action_space(),
                           epsilon=0.1,
                           init_alpha=.5,
                           gamma=.9,
                           decay_rate=.999)
        cart_pole_ctrl.set_learner(learner)

        cumulative_reward, num_steps = cart_pole_ctrl.train(number_epochs=2001)
        running_cumulative_reward.append(cumulative_reward)

    ar = np.array(running_cumulative_reward)
    means = np.mean(ar, axis=0)

    standard_errors = scipy.stats.sem(ar, axis=0)
    uperconf = means + standard_errors
    lowerconf = means - standard_errors
    # avg_cumulative = ar.sum(axis=0)
    # avg_cumulative = avg_cumulative/len(running_cumulative_reward)

    x = np.arange(0, len(means))
    # plt.plot(x, means, 'o')

    z = np.polyfit(x, means, 5)
    p = np.poly1d(z)
    plt.plot(x, p(x))

    plt.fill_between(x, uperconf, lowerconf, alpha=0.3, antialiased=True)

    # plt.ylim(ymax=50, ymin=-800)

    plt.show()
    plt.close()

    # z = np.arange(0, len(num_steps))
    # plt.plot(z, num_steps)
    # plt.show()
    # plt.close()

    cart_pole_ctrl.env.close()

示例#3

显示文件

def use_model():
    cart_pole_ctrl = Controller(None,
                                'CartPole-v1',
                                StateBuilderCartPole(),
                                communicate=False)
    # cart_pole_ctrl = Controller(None, 'Taxi-v2', None)
    # cart_pole_ctrl = Controller(None, 'LunarLander-v2', state_builder=StateBuilderLunarLander(), communicate=False)

    learner = QLearner(cart_pole_ctrl.get_action_space(),
                       epsilon=0.0,
                       init_alpha=.5,
                       gamma=.9)

    cart_pole_ctrl.set_learner(learner)
    cart_pole_ctrl.load("models/CartPole-v1-7.model")

    count = 0
    while True:
        cart_pole_ctrl.run(render=True)
        count += 1
        print("Epoch {}".format(count))

示例#4

显示文件

def start_reference_aggregated_learner(env_name: str = ''):
    state_builder = StateBuilderCache.builders.get(env_name, None)

    controller = Controller(learner=None,
                            env_id=env_name,
                            state_builder=state_builder)

    learner = QLearner(controller.get_action_space(),
                       epsilon=0.1,
                       init_alpha=.5,
                       gamma=.9,
                       decay_rate=.999)

    # SET MODEL with copy of Server Model
    learner.set_model(copy.deepcopy(QServer.Q))

    controller.set_learner(learner)

    agent_thread = threading.Thread(target=controller.run)
    agent_thread.start()
    print('Started Reference Learner')

    return