Python GameVariables.cost_tl1 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: game_dynamics.game_setup

클래스/타입: GameVariables

메소드/함수: cost_tl1

hotexamples.com에서의 예제들: 2

Python GameVariables.cost_tl1 - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 game_dynamics.game_setup.GameVariables.cost_tl1에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

cost_1_1(3)

cost_1_2(3)

cost_1_3(3)

cost_1_4(3)

cost_2_1(3)

cost_2_2(3)

cost_2_3(3)

cost_2_4(3)

GameVariables(2)

cost_tl(2)

cost_tl1(2)

cost_tl2(2)

social_cost(2)

예제 #1

파일 보기

class Environment():
    def __init__(self, p, q, num_players_1, num_players_2, sim_time):
        self.game = GameVariables(num_players_1=num_players_1,
                                  num_players_2=num_players_2,
                                  num_p=len(p),
                                  num_q=len(q),
                                  sim_time=sim_time)
        self.pvector = p
        self.qvector = q

    def reset(self):
        self.x = np.zeros(14)
        self.random_strategies()
        self.count_strategies()

        self.p = random.choice(self.pvector)
        self.q = random.choice(self.qvector)
        self.sim_step = 0

        self.file = open(
            './data/ind_q_nump_{}_numplayers_{}_simtime_{}.csv'.format(
                self.game.num_p, self.game.num_players_1, self.game.sim_time),
            'w')
        self.file.write('time,tl1,tl2,sc,r1,r2\n')

        return [[self.x[1], self.x[7]], [self.x[6], self.x[11]]]

    def close(self):
        self.file.close()

    def step(self, action):
        for i in range(self.game.num_players_1):

            strategycost1 = [
                self.game.cost_1_1(self.x, self.p, self.q),
                self.game.cost_1_2(self.x, self.p, self.q),
                self.game.cost_1_3(self.x, self.p, self.q),
                self.game.cost_1_4(self.x, self.p, self.q)
            ]
            self.choose_strategy_1(i, strategycost1)
            self.count_strategies()

        for i in range(self.game.num_players_2):

            strategycost2 = [
                self.game.cost_2_1(self.x, self.p, self.q),
                self.game.cost_2_2(self.x, self.p, self.q),
                self.game.cost_2_3(self.x, self.p, self.q),
                self.game.cost_2_4(self.x, self.p, self.q)
            ]

            self.choose_strategy_2(i, strategycost2)
            self.count_strategies()

        self.p = self.pvector[action['TL2']]
        self.q = self.qvector[action['TL1']]
        self.sim_step += 1
        if self.sim_step % 10 == 0:
            print('sim time ' + str(self.sim_step))

        rewards = self._compute_rewards(self.x)

        self.collect_data(rewards)
        observation_1 = [self.x[1], self.x[7]]
        observation_2 = [self.x[6], self.x[11]]
        return [observation_1, observation_2], rewards, False, {}

    def collect_data(self, rewards):
        sc = self.game.social_cost(self.x, self.p, self.q)
        #time,tl1,tl2,sc,reward
        self.file.write('{},{},{},{},{},{}\n'.format(self.sim_step, self.q,
                                                     self.p, sc,
                                                     rewards['TL1'],
                                                     rewards['TL2']))

    def _compute_rewards(self, strategies):
        rewards = {}
        rewards['TL1'] = -self.game.cost_tl1(strategies, self.q)
        rewards['TL2'] = -self.game.cost_tl2(strategies, self.p)
        return rewards

    def count_strategies(self):
        self.x[0] = sum(self.strategies1[0]) + sum(self.strategies1[1]) + sum(
            self.strategies1[2]) + sum(self.strategies1[3])
        self.x[1] = sum(self.strategies1[1]) + sum(self.strategies1[2]) + sum(
            self.strategies2[0]) + sum(self.strategies2[3])
        self.x[2] = sum(self.strategies1[2]) + sum(self.strategies2[0]) + sum(
            self.strategies2[1]) + sum(self.strategies1[3])
        self.x[3] = sum(self.strategies2[0]) + sum(self.strategies2[1]) + sum(
            self.strategies2[2])
        self.x[4] = sum(self.strategies2[0]) + sum(self.strategies2[3])
        self.x[5] = sum(self.strategies1[0]) + sum(self.strategies1[3])
        self.x[6] = sum(self.strategies1[1]) + sum(self.strategies2[3])
        self.x[7] = sum(self.strategies2[1]) + sum(self.strategies1[3])
        self.x[8] = sum(self.strategies1[2]) + sum(self.strategies1[3])
        self.x[9] = sum(self.strategies2[2]) + sum(self.strategies2[3])
        self.x[10] = sum(self.strategies2[0]) + sum(self.strategies2[1]) + sum(
            self.strategies2[2]) + sum(self.strategies2[3])
        self.x[11] = sum(self.strategies1[0]) + sum(self.strategies2[1]) + sum(
            self.strategies2[2]) + sum(self.strategies1[3])
        self.x[12] = sum(self.strategies1[0]) + sum(self.strategies1[1]) + sum(
            self.strategies2[2]) + sum(self.strategies2[3])
        self.x[13] = sum(self.strategies1[0]) + sum(self.strategies1[1]) + sum(
            self.strategies1[2]) + sum(self.strategies1[3])

    def random_strategies(self):
        self.strategies1 = np.zeros((4, self.game.num_players_1))
        randinitstrat = np.random.randint(4, size=self.game.num_players_1)
        for i in range(self.game.num_players_1):
            self.strategies1[randinitstrat[i]][i] = 1 / self.game.num_players_1

        self.strategies2 = np.zeros((4, self.game.num_players_2))
        randinitstrat = np.random.randint(4, size=self.game.num_players_2)
        for i in range(self.game.num_players_2):
            self.strategies2[randinitstrat[i]][i] = 1 / self.game.num_players_2

    def choose_strategy_1(self, i, strategycost1):
        if (strategycost1[0] <= strategycost1[1]
                and strategycost1[0] <= strategycost1[2]
                and strategycost1[0] <= strategycost1[3]):
            self.strategies1[0][i] = 1 / self.game.num_players_1
            self.strategies1[1][i] = 0
            self.strategies1[2][i] = 0
            self.strategies1[3][i] = 0
        elif (strategycost1[1] <= strategycost1[0]
              and strategycost1[1] <= strategycost1[2]
              and strategycost1[1] <= strategycost1[3]):
            self.strategies1[0][i] = 0
            self.strategies1[1][i] = 1 / self.game.num_players_1
            self.strategies1[2][i] = 0
            self.strategies1[3][i] = 0
        elif (strategycost1[2] <= strategycost1[1]
              and strategycost1[2] <= strategycost1[0]
              and strategycost1[2] <= strategycost1[3]):
            self.strategies1[0][i] = 0
            self.strategies1[1][i] = 0
            self.strategies1[2][i] = 1 / self.game.num_players_1
            self.strategies1[3][i] = 0
        else:
            self.strategies1[0][i] = 0
            self.strategies1[1][i] = 0
            self.strategies1[2][i] = 0
            self.strategies1[3][i] = 1 / self.game.num_players_1

    def choose_strategy_2(self, i, strategycost2):
        if (strategycost2[0] <= strategycost2[1]
                and strategycost2[0] <= strategycost2[2]
                and strategycost2[0] <= strategycost2[3]):
            self.strategies2[0][i] = 1 / self.game.num_players_2
            self.strategies2[1][i] = 0
            self.strategies2[2][i] = 0
            self.strategies2[3][i] = 0
        elif (strategycost2[1] <= strategycost2[0]
              and strategycost2[1] <= strategycost2[2]
              and strategycost2[1] <= strategycost2[3]):
            self.strategies2[0][i] = 0
            self.strategies2[1][i] = 1 / self.game.num_players_2
            self.strategies2[2][i] = 0
            self.strategies2[3][i] = 0
        elif (strategycost2[2] <= strategycost2[1]
              and strategycost2[2] <= strategycost2[0]
              and strategycost2[2] <= strategycost2[3]):
            self.strategies2[0][i] = 0
            self.strategies2[1][i] = 0
            self.strategies2[2][i] = 1 / self.game.num_players_2
            self.strategies2[3][i] = 0
        else:
            self.strategies2[0][i] = 0
            self.strategies2[1][i] = 0
            self.strategies2[2][i] = 0
            self.strategies2[3][i] = 1 / self.game.num_players_2

예제 #2

파일 보기

class Environment():

    def __init__(self, p, q, sim_time):
        self.game = GameVariables( num_p=len(p), num_q=len(q), sim_time=sim_time)
        self.pvector = p
        self.qvector = q

    def reset(self):
        self.x = np.zeros(14)
        self.random_strategies()
        self.count_strategies()

        self.p = random.choice(self.pvector)
        self.q = random.choice(self.qvector)

    def step(self, action):
        for i in range(self.game.num_players_1):
            
            strategycost1 = [self.game.cost_1_1(self.x,self.p,self.q), 
                              self.game.cost_1_2(self.x,self.p,self.q),
                              self.game.cost_1_3(self.x,self.p,self.q),
                              self.game.cost_1_4(self.x,self.p,self.q)]
            self.choose_strategy_1(strategycost1)
            self.count_strategies()

        for i in range(self.game.num_players_2):

            strategycost2 = [self.game.cost_2_1(self.x,self.p,self.q),
                              self.game.cost_2_2(self.x,self.p,self.q),
                              self.game.cost_2_3(self.x,self.p,self.q), 
                              self.game.cost_2_4(self.x,self.p,self.q)]
            self.choose_strategy_2(strategycost2)
            self.count_strategies()
            
        self.p = self.pvector[action['TL2']]
        self.q = self.qvector[action['TL1']]

        reward = self._compute_rewards(self.x)
        return self.x, reward, False, {}

    def _compute_rewards(self, strategies):
        rewards = {}
        rewards['TL1'] = - self.game.cost_tl1(strategies, self.q)
        rewards['TL2'] = - self.game.cost_tl2(strategies, self.p)
        return rewards
    
    def count_strategies(self):

        self.x[0] = sum(self.strategies1[0]) + sum(self.strategies1[1]) + sum(self.strategies1[2]) + sum(self.strategies1[3])
        self.x[1] = sum(self.strategies1[1]) + sum(self.strategies1[2]) + sum(self.strategies2[0]) + sum(self.strategies2[3])
        self.x[2] = sum(self.strategies1[2]) + sum(self.strategies2[0]) + sum(self.strategies2[1]) + sum(self.strategies1[3])
        self.x[3] = sum(self.strategies2[0]) + sum(self.strategies2[1]) + sum(self.strategies2[2])
        self.x[4] = sum(self.strategies2[0]) + sum(self.strategies2[3])
        self.x[5] = sum(self.strategies1[0]) + sum(self.strategies1[3])
        self.x[6] = sum(self.strategies1[1]) + sum(self.strategies2[3])
        self.x[7] = sum(self.strategies2[1]) + sum(self.strategies1[3])
        self.x[8] = sum(self.strategies1[2]) + sum(self.strategies1[3])
        self.x[9] = sum(self.strategies2[2]) + sum(self.strategies2[3])
        self.x[10] = sum(self.strategies2[0]) + sum(self.strategies2[1]) + sum(self.strategies2[2]) + sum(self.strategies2[3])
        self.x[11] = sum(self.strategies1[0]) + sum(self.strategies2[1]) + sum(self.strategies2[2]) + sum(self.strategies1[3])
        self.x[12] = sum(self.strategies1[0]) + sum(self.strategies1[1]) + sum(self.strategies2[2]) + sum(self.strategies2[3])
        self.x[13] = sum(self.strategies1[0]) + sum(self.strategies1[1]) + sum(self.strategies1[2]) + sum(self.strategies1[3])

    def random_strategies(self):
        self.strategies1 = np.zeros((4,self.game.num_players_1))
        randinitstrat = np.random.randint(4, size = self.game.num_players_1)
        for i in range(self.game.num_players_1):
            self.strategies1[randinitstrat[i]][i] = 1/self.game.num_players_1

        self.strategies2 = np.zeros((4,self.game.num_players_2))
        randinitstrat = np.random.randint(4, size = self.game.num_players_2)
        for i in range(game.num_players_2):
            self.strategies2[randinitstrat[i]][i] = 1/self.game.num_players_2

    def choose_strategy_1(self, strategycost1):
        if (strategycost1[0] <= strategycost1[1] and strategycost1[0] <= strategycost1[2]
                and strategycost1[0] <= strategycost1[3]):
                self.strategies1[0][i] = 1/self.game.num_players_1
                self.strategies1[1][i] = 0
                self.strategies1[2][i] = 0
                self.strategies1[3][i] = 0
        elif (strategycost1[1] <= strategycost1[0] and strategycost1[1] <= strategycost1[2]
                and strategycost1[1] <= strategycost1[3]):
            self.strategies1[0][i] = 0
            self.strategies1[1][i] = 1/self.game.num_players_1 
            self.strategies1[2][i] = 0
            self.strategies1[3][i] = 0
        elif (strategycost1[2] <= strategycost1[1] and strategycost1[2] <= strategycost1[0]
            and strategycost1[2] <= strategycost1[3]):
            self.strategies1[0][i] = 0
            self.strategies1[1][i] = 0
            self.strategies1[2][i] = 1/self.game.num_players_1 
            self.strategies1[3][i] = 0
        else: 
            self.strategies1[0][i] = 0
            self.strategies1[1][i] = 0
            self.strategies1[2][i] = 0
            self.strategies1[3][i] = 1/self.game.num_players_1 

    def choose_strategy_2(self, strategycost2):
        if (strategycost2[0] <= strategycost2[1] and strategycost2[0] <= strategycost2[2] and strategycost2[0] <= strategycost2[3]):
                self.strategies2[0][i] = 1/self.game.num_players_2
                self.strategies2[1][i] = 0
                self.strategies2[2][i] = 0
                self.strategies2[3][i] = 0
        elif (strategycost2[1] <= strategycost2[0] and strategycost2[1] <= strategycost2[2] and strategycost2[1] <= strategycost2[3]):
            self.strategies2[0][i] = 0
            self.strategies2[1][i] = 1/self.game.num_players_2
            self.strategies2[2][i] = 0
            self.strategies2[3][i] = 0
        elif (strategycost2[2] <= strategycost2[1] and strategycost2[2] <= strategycost2[0] and strategycost2[2] <= strategycost2[3]):
            self.strategies2[0][i] = 0
            self.strategies2[1][i] = 0
            self.strategies2[2][i] = 1/self.game.num_players_2
            self.strategies2[3][i] = 0
        else:
            self.strategies2[0][i] = 0
            self.strategies2[1][i] = 0
            self.strategies2[2][i] = 0
            self.strategies2[3][i] = 1/self.game.num_players_2