Python MSLFQの例

プログラミング言語: Python

名前空間/パッケージ名: MSLFQ

クラス/型: MSLFQ

hotexamples.comのコード掲載数: 3

Python MSLFQ - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのMSLFQ.MSLFQの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

fit_data(2)

fit(1)

process_data(1)

コード例 #1

ファイルを表示

ファイル: MSLFQ_Test.py プロジェクト: bionicv/mslfq

    def testMultiStage(self):
        # set up data
        stages = 2
        data = []
        s = [1, 1]
        a = "Drug_A"
        r = 1.0
        ns = [1, 1]

        data.append([1, s, a, r, ns])
        a = "Drug_B"
        r = 0.0
        ns = [1, 1]
        data.append([1, s, a, r, ns])

        s = [0, 0]
        a = "Drug_B"
        r = 0.0
        ns = [1, 1]

        data.append([0, s, a, r, ns])
        a = "Drug_A"
        r = 0.0
        ns = [0, 0]
        data.append([0, s, a, r, ns])
        learner = MSLFQ(stages=stages, gamma=1.0)

        weights = learner.fit_data(data, self.env)
        self.assertEqual(len(weights), 2)
        self.assertEqual(len(weights[0]), 6)

        print weights

コード例 #2

ファイルを表示

ファイル: MSLFQ_Test.py プロジェクト: bionicv/mslfq

    def setUp(self):

        # Set up environment
        actions = ["Drug_A", "Drug_B"]
        num_features = 2
        gamma = 0.99
        stages = 1
        self.env = DummyEnvironment(feature_size=num_features, stages=1, gamma=gamma, actions=actions)

        # set up data

        self.data = []
        s = [1, 1]
        a = "Drug_A"
        r = 1.0
        ns = [0, 0]

        self.data.append([0, s, a, r, ns])

        s = [1, 1]
        a = "Drug_B"
        r = 0.0
        ns = [0, 0]

        self.data.append([0, s, a, r, ns])

        self.learner = MSLFQ(stages=stages, gamma=gamma)

コード例 #3

ファイルを表示

ファイル: MSLFQ_Test.py プロジェクト: bionicv/mslfq

class Test(unittest.TestCase):
    def setUp(self):

        # Set up environment
        actions = ["Drug_A", "Drug_B"]
        num_features = 2
        gamma = 0.99
        stages = 1
        self.env = DummyEnvironment(feature_size=num_features, stages=1, gamma=gamma, actions=actions)

        # set up data

        self.data = []
        s = [1, 1]
        a = "Drug_A"
        r = 1.0
        ns = [0, 0]

        self.data.append([0, s, a, r, ns])

        s = [1, 1]
        a = "Drug_B"
        r = 0.0
        ns = [0, 0]

        self.data.append([0, s, a, r, ns])

        self.learner = MSLFQ(stages=stages, gamma=gamma)

    def testDummyEnvironment(self):
        state = [1.0, 1.0]
        action = "Drug_A"
        stage = 1
        features = self.env.phi(stage, state, action)

        result_list = [1.0, 1.0, 1.0, 0, 0, 0]
        self.assertListEqual(list(features), result_list)

        action = "Drug_B"
        result_list = [0, 0, 0, 1.0, 1.0, 1.0]
        features = self.env.phi(stage, state, action)
        self.assertListEqual(list(features), result_list)

    def testProcessDataFit(self):
        self.learner.process_data(self.data, self.env)

        n_data = self.learner.data_

        result_list = [1.0, 1.0, 1.0, 0, 0, 0]

        features = n_data[0][0]
        target = n_data[0][1]

        self.assertListEqual(list(features[0]), result_list)
        self.assertEqual(target[0], 1.0)

        result_list = [0, 0, 0, 1.0, 1.0, 1.0]
        self.assertListEqual(list(features[1]), result_list)
        self.assertEqual(target[1], 0.0)

        weights = self.learner.fit(features, target)

        self.assertEqual(np.sign(weights[0]), 1)
        self.assertEqual(np.sign(weights[3]), -1)

    def testLongFit(self):
        weights = self.learner.fit_data(self.data, self.env)

        self.assertEqual(len(weights), 1)
        self.assertEqual(len(weights[0]), 6)

    def testMultiStage(self):
        # set up data
        stages = 2
        data = []
        s = [1, 1]
        a = "Drug_A"
        r = 1.0
        ns = [1, 1]

        data.append([1, s, a, r, ns])
        a = "Drug_B"
        r = 0.0
        ns = [1, 1]
        data.append([1, s, a, r, ns])

        s = [0, 0]
        a = "Drug_B"
        r = 0.0
        ns = [1, 1]

        data.append([0, s, a, r, ns])
        a = "Drug_A"
        r = 0.0
        ns = [0, 0]
        data.append([0, s, a, r, ns])
        learner = MSLFQ(stages=stages, gamma=1.0)

        weights = learner.fit_data(data, self.env)
        self.assertEqual(len(weights), 2)
        self.assertEqual(len(weights[0]), 6)

        print weights