Python Collector.collect_data Exemples

Langage de programmation: Python

Espace de nommage/Pack: collector

Class/Type: Collector

Méthode/Fonction: collect_data

Exemples au hotexamples.com: 1

Python Collector.collect_data - 1 exemples trouvés. Ce sont les exemples réels les mieux notés de collector.Collector.collect_data extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Collector(30)

collect(30)

connect(11)

add(7)

__init__(6)

download(6)

save_all_meiju_info(4)

delete(4)

is_meiju_info_file_exist(4)

read_all_meiju_info_from_file(4)

write_all_meiju_info_to_file(4)

applySettings(3)

average(3)

count(3)

setReflectogrammLength(2)

add_feed(2)

get_feeds(2)

CreateCollector(2)

get_items(2)

has_feed(2)

collect_loss(2)

derive_folders(2)

setSpectraLength(2)

scrape_sites(2)

schedule_jobs(2)

clear_buffer(2)

update_feed(1)

get_actual_temperature(1)

get_feed(1)

save_all_meiju_update_info(1)

update_item_tag(1)

get_loaded_page(1)

print_items(1)

get_requirements(1)

get_text_from_items(1)

rm_feed(1)

report(1)

stream(1)

setNextIndex(1)

print_feed(1)

print_feeds(1)

load_log(1)

count_assembly_code_bytes(1)

disconnect(1)

closeAll(1)

add_column(1)

add_enemy_at_pos(1)

add_spawn_cell(1)

add_symbol(1)

add_treasure_at_pos(1)

Méthodes fréquemment utilisées

Collector (30)

collect (30)

connect (11)

add (7)

__init__ (6)

download (6)

save_all_meiju_info (4)

delete (4)

is_meiju_info_file_exist (4)

read_all_meiju_info_from_file (4)

Méthodes fréquemment utilisées

write_all_meiju_info_to_file (4)

applySettings (3)

average (3)

count (3)

setReflectogrammLength (2)

add_feed (2)

get_feeds (2)

CreateCollector (2)

get_items (2)

has_feed (2)

collect_loss (2)

derive_folders (2)

setSpectraLength (2)

scrape_sites (2)

schedule_jobs (2)

clear_buffer (2)

update_feed (1)

get_actual_temperature (1)

get_feed (1)

save_all_meiju_update_info (1)

Méthodes fréquemment utilisées

collect_loss (2)

derive_folders (2)

setSpectraLength (2)

scrape_sites (2)

schedule_jobs (2)

clear_buffer (2)

update_feed (1)

get_actual_temperature (1)

get_feed (1)

save_all_meiju_update_info (1)

update_item_tag (1)

get_loaded_page (1)

print_items (1)

get_requirements (1)

get_text_from_items (1)

rm_feed (1)

report (1)

stream (1)

setNextIndex (1)

print_feed (1)

print_feeds (1)

load_log (1)

count_assembly_code_bytes (1)

disconnect (1)

closeAll (1)

add_column (1)

add_enemy_at_pos (1)

add_spawn_cell (1)

add_symbol (1)

add_treasure_at_pos (1)

Méthodes fréquemment utilisées

update_item_tag (1)

get_loaded_page (1)

print_items (1)

get_requirements (1)

get_text_from_items (1)

rm_feed (1)

report (1)

stream (1)

setNextIndex (1)

print_feed (1)

print_feeds (1)

load_log (1)

count_assembly_code_bytes (1)

disconnect (1)

closeAll (1)

add_column (1)

add_enemy_at_pos (1)

add_spawn_cell (1)

add_symbol (1)

add_treasure_at_pos (1)

appendDragonResponse (1)

appendOnChipTemperature (1)

check_all_items (1)

clean (1)

clear (1)

clear_data (1)

close (1)

collapsed_root_folders (1)

data_points (1)

collect_bonus (1)

collect_book_data (1)

collect_data (1)

collect_data_from_list_of_books (1)

collect_finance (1)

collect_market (1)

collect_metrics (1)

collect_phrase (1)

collect_stock_information (1)

collector (1)

create_tenants_bills (1)

Exemple #1

0

Afficher le fichier

Fichier : trainers.py Projet : RedTachyon/udacity-collaboration-ppo

class PPOTrainer(Trainer): """This performs training in a sampling paradigm, where each agent is stored, and during data collection, some part of the dataset is collected with randomly sampled old agents""" def __init__(self, agents: Dict[str, Agent], env: UnityEnvironment, config: Dict[str, Any]): super().__init__(agents, env, config) default_config = { "steps": 2000, # Tensorboard settings "tensorboard_name": None, # str, set explicitly "gamma": .99, # Discount factor "tau": .95, # PPO "ppo_config": { "optimizer": "adam", "optimizer_kwargs": { "lr": 1e-3, "betas": (0.9, 0.999), "eps": 1e-7, "weight_decay": 0, "amsgrad": False }, # "batch_size": 64, "minibatches": 32, # PPO settings "ppo_steps": 5, "eps": 0.1, # PPO clip parameter "target_kl": 0.01, # KL divergence limit "value_loss_coeff": 0.1, "entropy_coeff": 0.01, "max_grad_norm": 0.5, # GPU "use_gpu": False, } } self.config = with_default_config(config, default_config) self.collector = Collector(agents=self.agents, env=self.env) self.ppo = PPOptimizer(agents=agents, config=self.config["ppo_config"]) # Setup tensorboard self.writer: SummaryWriter if self.config["tensorboard_name"]: dt_string = datetime.now().strftime("%Y-%m-%d_%H-%M-%S") self.path = Path.home( ) / "drlnd_logs" / f"{self.config['tensorboard_name']}_{dt_string}" self.writer = SummaryWriter(str(self.path)) self.agent_paths = [ self.path / agent_id for agent_id in self.agents ] for agent_path in self.agent_paths: os.mkdir(str(agent_path)) # Log the configs with open(str(self.path / "trainer_config.json"), "w") as f: json.dump(self.config, f) with open(str(self.path / f"agent0_config.json"), "w") as f: json.dump(self.agents["Agent0"].model.config, f) with open(str(self.path / f"agent1_config.json"), "w") as f: json.dump(self.agents["Agent1"].model.config, f) self.path = str(self.path) else: self.writer = None def train(self, num_iterations: int, save_path: Optional[str] = None, disable_tqdm: bool = False, **collect_kwargs): print(f"Begin training, logged in {self.path}") timer = Timer() step_timer = Timer() # Store the first agent # saved_agents = [copy.deepcopy(self.agent.model.state_dict())] if save_path: for path, (agent_id, agent) in zip(self.agent_paths, self.agents.items()): torch.save(agent.model, os.path.join(str(path), "base_agent.pt")) rewards = [] for step in trange(num_iterations, disable=disable_tqdm): ########################################### Collect the data ############################################### timer.checkpoint() # data_batch = self.collector.collect_data(num_episodes=self.config["episodes"]) data_batch = self.collector.collect_data( num_steps=self.config["steps"], gamma=self.config["gamma"], tau=self.config["tau"]) data_time = timer.checkpoint() ############################################## Update policy ############################################## # Perform the PPO update metrics = self.ppo.train_on_data(data_batch, step, writer=self.writer) # eval_batch = self.collector.collect_data(num_steps=1001) # reward = eval_batch['rewards'].sum().item() # rewards.append(reward) end_time = step_timer.checkpoint() # Save the agent to disk if save_path: for path, (agent_id, agent) in zip(self.agent_paths, self.agents.items()): torch.save(agent.model.state_dict(), os.path.join(str(path), f"weights_{step + 1}")) # Write training time metrics to tensorboard time_metrics = { "agent/time_data": data_time, "agent/time_total": end_time, # "agent/eval_reward": reward } write_dict(time_metrics, step, self.writer)