Python Config.max_episodes Beispiele

Programmiersprache: Python

Namespace / Paketname: utils.conf

Klasse / Typ: Config

Methode / Funktion: max_episodes

Beispiele auf hotexamples.com: 2

Python Config.max_episodes - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die utils.conf.Config.max_episodes, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

root_dir(6)

max_steps(5)

replay_size(3)

entropy_weight(2)

model_save_int(2)

max_episodes(2)

learning_rate(2)

Config(2)

discount(1)

ppo_update_int(1)

sub_policy_num(1)

storage_device(1)

agent_ratio(1)

conv(1)

q_increase_rate(1)

q_decrease_rate(1)

profile_int(1)

ppo_update_times(1)

ppo_update_batch_size(1)

device(1)

policy_noise_params(1)

neighbor_num(1)

ddpg_average_target_int(1)

agent_num(1)

ddpg_update_batch_size(1)

map_size(1)

ddpg_warmup_steps(1)

get_data_prop(1)

explore_noise_params(1)

workers(1)

Beispiel #1

Datei anzeigen

Datei: walker_naive_ddpg_td3.py Projekt: mrshenli/machin

from utils.tensor_board import global_board
from utils.helper_classes import Counter, Timer
from utils.conf import Config
from utils.save_env import SaveEnv
from utils.prep import prep_args

from env.walker.single_walker import BipedalWalker

# definitions
observe_dim = 24
action_dim = 4

# configs
c = Config()
#c.restart_from_trial = "2020_05_06_21_50_57"
c.max_episodes = 5000
c.max_steps = 1000
c.replay_size = 500000

# or: explore_noise_params = [(0, 0.2)] * action_dim
c.explore_noise_params = (0, 0.2)
c.policy_noise_params = (0, 1.0, -0.5, 0.5)
c.device = "cuda:0"
c.root_dir = "/data/AI/tmp/multi_agent/walker/naive_ddpg_td3/"

# train configs
# lr: learning rate, int: interval
# warm up should be less than one epoch
c.ddpg_update_batch_size = 100
c.ddpg_warmup_steps = 200
c.model_save_int = 100  # in episodes

Beispiel #2

Datei anzeigen

from utils.tensor_board import global_board
from utils.helper_classes import Counter, Timer
from utils.conf import Config
from utils.save_env import SaveEnv
from utils.prep import prep_args

from env.walker.carrier import BipedalMultiCarrier

# definitions
observe_dim = 28
action_dim = 4

# configs
c = Config()
# c.restart_from_trial = "2020_05_06_21_50_57"
c.max_episodes = 20000
c.max_steps = 2000
c.replay_size = 500000

c.agent_num = 3
c.sub_policy_num = 1
c.explore_noise_params = (0, 0.2)
c.q_increase_rate = 1
c.q_decrease_rate = 1
c.device = "cuda:0"
c.root_dir = "/data/AI/tmp/multi_agent/mcarrier/maddpg/"

# train configs
# lr: learning rate, int: interval
# warm up should be less than one epoch
c.ddpg_update_batch_size = 100