Python Model Beispiele, librubiks.model.Model Python Beispiele

Beispiel #1

0

Datei anzeigen

Datei: test_model.py Projekt: peleiden/librubiks

	def test_save_and_load(self):
		torch.manual_seed(42)

		config = ModelConfig()
		model = Model.create(config, logger=NullLogger())
		model_dir = "local_tests/local_model_test"
		model.save(model_dir)
		assert os.path.exists(f"{model_dir}/config.json")
		assert os.path.exists(f"{model_dir}/model.pt")

		model = Model.load(model_dir).to(gpu)
		assert next(model.parameters()).device.type == gpu.type

Beispiel #2

0

Datei anzeigen

Datei: train.py Projekt: peleiden/librubiks

	def _update_gen_net(self, generator_net: Model, net: Model):
		"""Create a network with parameters weighted by self.tau"""
		self.tt.profile("Creating generator network")
		genparams, netparams = generator_net.state_dict(), net.state_dict()
		new_genparams = dict(genparams)
		for pname, param in netparams.items():
			new_genparams[pname].data.copy_(
					self.tau * param.data.to(gpu) + (1-self.tau) * new_genparams[pname].data.to(gpu)
					)
		generator_net.load_state_dict(new_genparams)
		self.tt.end_profile("Creating generator network")
		return generator_net.to(gpu)

Beispiel #3

0

Datei anzeigen

Datei: __init__.py Projekt: peleiden/librubiks

	def rollout(self, net: Model, rollout: int, value_targets: torch.Tensor):
		"""Saves statistics after a rollout has been performed for understanding the loss development

		:param torch.nn.Model net: The current net, used for saving values and policies of first 12 states
		:param rollout int: The rollout number. Used to determine whether it is evaluation time => check targets
		:param torch.Tensor value_targets: Used for visualizing value change
		"""
		# First time
		if self.params is None: self.params = net.get_params()

		# Keeping track of the entropy off on the 12-dimensional log-probability policy-output
		entropies = [entropy(policy, axis=1) for policy in self.rollout_policy]
		#Currently:  Mean over all games in entire rollout. Maybe we want it more fine grained later.
		self.policy_entropies.append(np.mean( [np.nanmean(entropy) for entropy in entropies] ))
		self.rollout_policy = list() #reset for next rollout

		if rollout in self.evaluations:
			net.eval()

			# Calculating value targets
			targets = value_targets.cpu().numpy().reshape((-1, self.depth))
			self.avg_value_targets.append(targets.mean(axis=0))

			# Calculating model change
			model_change = torch.sqrt((net.get_params()-self.params)**2).mean().cpu()
			model_total_change = torch.sqrt((net.get_params()-self.orig_params)**2).mean().cpu()
			self.params = net.get_params()
			self.param_changes.append(float(model_change))
			self.param_total_changes.append(model_total_change)

			#In the beginning: Calculate value given to first 12 substates
			if rollout <= self.extra_evals:
				self.first_state_values.append( net(self.first_states, policy=False, value=True).detach().cpu().numpy() )

			net.train()

Beispiel #4

0

Datei anzeigen

Datei: test_train.py Projekt: peleiden/librubiks

    def test_train(self):
        torch.manual_seed(42)
        #The standard test
        net = Model.create(ModelConfig())
        evaluator = Evaluator(2,
                              max_time=.02,
                              max_states=None,
                              scrambling_depths=[2])
        train = Train(rollouts=2,
                      batch_size=2,
                      tau=0.1,
                      alpha_update=.5,
                      gamma=1,
                      rollout_games=2,
                      rollout_depth=3,
                      optim_fn=torch.optim.Adam,
                      agent=PolicySearch(None),
                      lr=1e-6,
                      evaluation_interval=1,
                      evaluator=evaluator,
                      update_interval=1,
                      with_analysis=True,
                      reward_method='schultzfix')

        # Current
        net, min_net = train.train(net)

        train.plot_training("local_tests/local_train_test", "test")
        assert os.path.exists("local_tests/local_train_test/training_test.png")

Beispiel #5

0

Datei anzeigen

Datei: test_model.py Projekt: peleiden/librubiks

	def test_resnet(self):
		config = ModelConfig(architecture = 'res_big')
		model = Model.create(config)
		assert next(model.parameters()).device.type == gpu.type
		model.eval()
		x = torch.randn(2, 480).to(gpu)
		model(x)
		model.train()
		model(x)

Beispiel #6

0

Datei anzeigen

Datei: test_model.py Projekt: peleiden/librubiks

	def test_model(self):
		config = ModelConfig()
		model = Model.create(config)
		assert next(model.parameters()).device.type == gpu.type
		model.eval()
		x = torch.randn(2, 480).to(gpu)
		model(x)
		model.train()
		model(x)

Beispiel #7

0

Datei anzeigen

	def test_agent_optim(self, agents=['MCTS', 'AStar', 'EGVM']):

		run_path = os.path.join( os.path.dirname(os.path.dirname(os.path.abspath(__file__))), 'librubiks', 'solving', 'hyper_optim.py' )
		location = 'local_tests/optim'

		net = Model(ModelConfig())
		net.save(location)
		for agent in agents:

			run_settings = { 'location': location, 'agent': agent, 'iterations': 1, 'eval_games': 1, 'depth': 2, 'save_optimal': True, 'use_best': True, 'optimizer': 'BO' }
			args = [sys.executable, run_path,]
			for k, v in run_settings.items(): args.extend([f'--{k}', str(v)])
			subprocess.check_call(args)  # Raises error on problems in call

			expected_files = [f'{agent}_optimization.log', f'{agent}_params.json']

			for fname in expected_files: assert fname in os.listdir(location)

		return location

Beispiel #8

0

Datei anzeigen