Python Reporter.report 예제들, utils.reporter.Reporter.report Python 예제들

예제 #1

0

파일 보기

파일: logger.py 프로젝트: marcocspc/URNAI-Tools

    def log_training_start_information(self):
        text = ("\n   Agent: {}\n".format(self.agent_name) +
                "   ActionWrapper: {}\n".format(self.action_wrapper_name) +
                "   StateBuilder: {}\n".format(self.state_builder_name) +
                "   RewardBuilder: {}\n".format(self.reward_builder_name) +
                "   Environment: {}\n".format(self.env_name) +
                "   Model: {}\n".format(self.model_name))

        if (hasattr(self.model, "lib")):
            if self.model.neural_net_class != None:
                if self.model.lib == constants.Libraries.KERAS:
                    stringlist = []
                    self.model.dnn.model.summary(
                        print_fn=lambda x: stringlist.append(x))
                    short_model_summary = "\n".join(stringlist)
                    text += "       " + short_model_summary
                if self.model.lib == constants.Libraries.PYTORCH:
                    text += "       " + self.model.dnn.model
            else:
                for idx, (layer) in enumerate(self.model.build_model):
                    text += "       Layer {}: {}\n".format(
                        idx, self.model.build_model[idx])
        else:
            for idx, (layer) in enumerate(self.model.build_model):
                text += "       Layer {}: {}\n".format(
                    idx, self.model.build_model[idx])

        self.training_report += text

        rp.report(text)

예제 #2

0

파일 보기

 def save(self, savepath):
     '''
     This method saves pickle objects
     and extra stuff needed
     '''
     rp.report("Saving {} object...".format(self.__class__.__name__), verbosity_lvl=1)
     self.save_pickle(savepath)
     self.save_extra(savepath)

예제 #3

0

파일 보기

    def ask_for_continue(self):
        if self.version != self.__curr_version:
            answer = ""
            while answer.lower() != "y" and answer.lower() != "n":
                answer = rp.input("The loaded training version is {} and the current version is {}. This difference can cause some kind of error while proceeding to the training, do you wish to continue? [y/n]".format(self.version, self.__curr_version), "n")

                if answer.lower() == "n":
                    rp.report("The training was stopped.")
                    exit()

예제 #4

0

파일 보기

파일: buildunits.py 프로젝트: marcocspc/URNAI-Tools

    def get_sc2_reward(self, obs):
        build_supply_depot = BuildUnitsGeneralizedRewardBuilder.ACTION_BUILD_SUPPLY_DEPOT
        build_barrack = BuildUnitsGeneralizedRewardBuilder.ACTION_BUILD_BARRACK
        build_marine = BuildUnitsGeneralizedRewardBuilder.ACTION_BUILD_MARINE
        do_nothing = BuildUnitsGeneralizedRewardBuilder.ACTION_DO_NOTHING

        current = self.get_sc2_number_of_supply_depot(obs)
        prev = self.get_sc2_number_of_supply_depot(self.previous_state)
        supply_depot_amount_diff = (current - prev)

        current = self.get_sc2_number_of_barracks(obs)
        prev = self.get_sc2_number_of_barracks(self.previous_state)
        barracks_amount_diff = (current - prev)

        current = self.get_sc2_number_of_marines(obs)
        prev = self.get_sc2_number_of_marines(self.previous_state)
        marines_amount_diff = (current - prev)

        negative_rwd = 0
        chosen_action = BuildUnitsGeneralizedRewardBuilder.LAST_CHOSEN_ACTION
        if chosen_action > -1:
            supply_depot_amount = self.get_sc2_number_of_supply_depot(obs)
            barracks_amount = self.get_sc2_number_of_barracks(obs)
            minerals = obs.player.minerals
            if chosen_action == build_supply_depot:
                if supply_depot_amount > 7 or minerals < 100:
                    negative_rwd = -10
            elif chosen_action == build_barrack:
                if supply_depot_amount <= 0 or minerals < 150:
                    negative_rwd = -10
            elif chosen_action == build_marine:
                if barracks_amount <= 0 or minerals < 50:
                    negative_rwd = -10
            #elif chosen_action == do_nothing:
            #    negative_rwd = -1

        #rwd = negative_rwd + rwdB + rwdC
        rp.report('''
Calculated reward is: {},
composed of:
supply_depot_amount: {},
barracks_amount: {},
marines_amount: {},
negative_rdw: {}
                '''.format(
            negative_rwd + supply_depot_amount_diff +
            barracks_amount_diff * 10 + marines_amount_diff * 100,
            supply_depot_amount_diff, barracks_amount_diff * 10,
            marines_amount_diff * 100, negative_rwd),
                  verbosity_lvl=1)
        if supply_depot_amount_diff < 0 or barracks_amount_diff < 0 or marines_amount_diff < 0:
            return 0
        else:
            rwd = negative_rwd + supply_depot_amount_diff + barracks_amount_diff * 10 + marines_amount_diff * 100
            return rwd

예제 #5

0

파일 보기

 def load_pickle(self, persist_path):
     '''
     This method loads a list instance
     saved by pickle.
     '''
     #Check if pickle file exists
     pickle_path = self.get_full_persistance_pickle_path(persist_path)
     exists_pickle = os.path.isfile(pickle_path)
     #If yes, load it
     if exists_pickle:
         if os.path.getsize(pickle_path) > 0: 
             with open(pickle_path, "rb") as pickle_in: 
                 pickle_dict = pickle.load(pickle_in)
                 self.restore_pickleable_attributes(pickle_dict)
                 rp.report("**************************************** \n Pickle for " + self.get_default_save_stamp() + " loaded. \n****************************************", 1)

예제 #6

0

파일 보기

파일: logger.py 프로젝트: marcocspc/URNAI-Tools

    def log_train_stats(self):
        if self.ep_count > 0:
            text = ("\n" + "Current Reward Avg.: {}".format(
                sum(self.ep_rewards) / self.ep_count) +
                    " Win rate: {:10.3f}%".format(
                        (sum(self.ep_victories) / self.ep_count) * 100) +
                    " Avg number of steps: {}".format(
                        sum(self.ep_avg_steps) / self.ep_count) +
                    " Training Duration (seconds): {}".format(
                        round(time() - self.training_start, 2)) + "\n")

            self.training_report += text

            rp.report(text)
        else:
            rp.report("There are no recorded episodes!")

예제 #7

0

파일 보기

    def step(self, action):
        if (self.game == GeneralizedBuildUnitsScenario.GAME_DEEP_RTS):
            BuildUnitsGeneralizedRewardBuilder.LAST_CHOSEN_ACTION = action
            if self.steps == 0:
                self.setup_map()
                self.spawn_army()
            elif self.steps == 1:
                self.collect_gold()

            if rp.VERBOSITY_LEVEL > 0:
                str_ = '''  DRTS Episode Status:
                 Number of gold = {},
                 Number of barracks = {},
                 Number of farms = {},
                 Number of soldiers = {}'''.format(
                         self.env.players[0].gold,
                         self.get_drts_unit_type_count(0, self.env.constants.Unit.Barracks),
                         self.get_drts_unit_type_count(0, self.env.constants.Unit.Farm),
                         self.get_drts_unit_type_count(0, self.env.constants.Unit.Footman),
                         )
                rp.report(str_, verbosity_lvl=1)
            state, reward, done = None, None, None 
            if action == GeneralizedBuildUnitsScenario.ACTION_DRTS_DO_NOTHING:
                no_action = 15
                state, reward, done = self.env.step(no_action)
            elif action == GeneralizedBuildUnitsScenario.ACTION_DRTS_BUILD_FARM:
                self.build_farm()
                no_action = 15
                state, reward, done = self.env.step(no_action)
            elif action == GeneralizedBuildUnitsScenario.ACTION_DRTS_BUILD_BARRACK:
                self.build_barrack()
                no_action = 15
                state, reward, done = self.env.step(no_action)
            elif action == GeneralizedBuildUnitsScenario.ACTION_DRTS_BUILD_FOOTMAN:
                self.build_footman()
                no_action = 15
                state, reward, done = self.env.step(no_action)
            else:
                state, reward, done = self.env.step(action)
            self.steps += 1
            return state, reward, done 

        elif (self.game == GeneralizedBuildUnitsScenario.GAME_STARCRAFT_II):
            self.steps += 1
            return self.env.step(action)

예제 #8

0

파일 보기

파일: logger.py 프로젝트: marcocspc/URNAI-Tools

    def log_ep_stats(self):
        if self.ep_count > 0:

            agent_info = dict.fromkeys(self.agent_info)
            for key in agent_info:
                agent_info[key] = self.agent_info[key][-1]

            rp.report(
                "Episode: {}/{} | Outcome: {} | Episode Avg. Reward: {:10.6f} | Episode Reward: {:10.6f} | Episode Steps: {:10.6f} | Best Reward was {} on episode: {} | Episode Duration (seconds): {} | Episode SPS: {} | SPS AVG: {} | Agent info: {}"
                .format(self.ep_count, self.ep_total, self.ep_victories[-1],
                        self.ep_avg_rewards[-1], self.ep_rewards[-1],
                        self.ep_steps_count[-1], self.best_reward,
                        self.best_reward_episode,
                        self.episode_duration_list[-1],
                        self.episode_sps_list[-1], self.avg_sps_list[-1],
                        agent_info))
        else:
            rp.report("There are no recorded episodes!")

예제 #9

0

파일 보기