Ejemplos de DefaultMunch.n_episodes en Python

Lenguaje de programación: Python

Namespace/Package Name: munch

Clase / Tipo: DefaultMunch

Método / Función: n_episodes

Ejemplos en hotexamples.com: 2

Python DefaultMunch.n_episodes - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de munch.DefaultMunch.n_episodes extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

DefaultMunch(30)

fromDict(30)

url(4)

name(3)

tick_size(3)

instrument_name(3)

api_key(3)

api_secret(3)

orders(2)

price_rounding(2)

n_episodes(2)

mid_price_based_calculation(2)

stop_strategy_on_error(2)

max_action(2)

items(2)

update(2)

learn_start(2)

device(2)

std(1)

upnp_packet_type(1)

upnp_os_name(1)

seed(1)

send_post_only_orders(1)

upnp_nts(1)

state_size(1)

update_every(1)

upnp_cache(1)

upnp_nt(1)

sum(1)

tau(1)

upnp_version(1)

upnp_product_name(1)

upnp_location(1)

upnp_uns(1)

min(1)

positional_retreat(1)

fromYAML(1)

append(1)

attrs(1)

batch_size(1)

buffer_size(1)

cancel_orders_on_reconnection(1)

cancel_orders_on_start(1)

copy(1)

entropy(1)

fromJSON(1)

gamma(1)

p25(1)

iqr(1)

lr_actor(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: training.py Proyecto: phate09/drl_collab_compet

 brain = env.brains[env.brain_names[0]]
 env_info = env.reset(train_mode=True)[env.brain_names[0]]
 n_agents = len(env_info.agents)
 print('Number of agents:', n_agents)
 action_size = brain.vector_action_space_size
 state_size = brain.vector_observation_space_size
 state_multiplier = brain.num_stacked_vector_observations
 action_type = brain.vector_action_space_type
 comment = f"MADDPG Unity Tennis"
 log_dir = os.path.join('./runs', current_time + '_' + comment)
 os.mkdir(log_dir)
 print(f"logging to {log_dir}")
 writer = SummaryWriter(log_dir=log_dir)
 config = DefaultMunch()
 config.seed = seed
 config.n_episodes = 40000
 config.max_t = 1000
 config.buffer_size = 100000
 config.batch_size = 200
 config.gamma = 0.99
 config.tau = 0.001
 config.lr_actor = 0.0001
 config.lr_critic = 0.0001
 config.n_agents = n_agents
 config.state_size = state_size * state_multiplier
 config.action_size = action_size
 config.learn_start = 10000
 config.max_action = 1  # maximum value allowed for each action
 config.memory = ExperienceReplayMemory(config.buffer_size, seed)
 config.update_every = 2
 config.device = torch.device(

Ejemplo n.º 2

Mostrar archivo

                        worker_id=worker_id,
                        seed=seed,
                        no_graphics=False)
 brain = env.brains[env.brain_names[0]]
 env_info = env.reset(train_mode=False)[env.brain_names[0]]
 n_agents = len(env_info.agents)
 print('Number of agents:', n_agents)
 action_size = brain.vector_action_space_size
 state_size = brain.vector_observation_space_size
 state_multiplier = brain.num_stacked_vector_observations
 action_type = brain.vector_action_space_type
 comment = f"MADDPG Unity Tennis"
 rand_seed = 0
 config = DefaultMunch()
 config.seed = seed
 config.n_episodes = 10
 config.max_t = 1000
 config.buffer_size = 100000
 config.batch_size = 200
 config.gamma = 0.99
 config.tau = 0.001
 config.lr_actor = 0.0001
 config.lr_critic = 0.001
 config.n_agents = n_agents
 config.state_size = state_size * state_multiplier
 config.action_size = action_size
 config.learn_start = 3000
 config.max_action = 1
 config.memory = ExperienceReplayMemory(config.buffer_size, rand_seed)
 config.update_every = 2
 config.device = device