Esempi in Python per GridworldContinuousEnum

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: ml.rl.test.gridworld.gridworld_continuous_enum

Classe/tipologia: GridworldContinuousEnum

Esempi su hotexamples.com: 6

GridworldContinuousEnum in Python: 6 esempi trovati. Questi sono i migliori esempi reali in Python per ml.rl.test.gridworld.gridworld_continuous_enum.GridworldContinuousEnum, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

GridworldContinuousEnum(6)

generate_samples(4)

preprocess_samples(4)

Esempio n. 1

Mostra file

File: test_gridworld_continuous.py Progetto: robot-ai-machinelearning/BlueWhale

    def test_trainer_sarsa_enum(self):
        environment = GridworldContinuousEnum()
        states, actions, rewards, next_states, next_actions, is_terminal,\
            possible_next_actions, reward_timelines = \
            environment.generate_samples(100000, 1.0)
        trainer = self.get_sarsa_trainer(environment)
        predictor = trainer.predictor()
        evaluator = GridworldContinuousEvaluator(environment, False)
        tdps = environment.preprocess_samples(
            states,
            actions,
            rewards,
            next_states,
            next_actions,
            is_terminal,
            possible_next_actions,
            reward_timelines,
            self.minibatch_size,
        )

        self.assertGreater(evaluator.evaluate(predictor), 0.15)

        for tdp in tdps:
            trainer.train_numpy(tdp, None)
        evaluator.evaluate(predictor)

        self.assertLess(evaluator.evaluate(predictor), 0.05)

Esempio n. 2

Mostra file

    def test_trainer_sarsa_enum(self):
        environment = GridworldContinuousEnum()
        samples = environment.generate_samples(100000, 1.0)
        trainer = self.get_sarsa_trainer(environment)
        predictor = trainer.predictor()
        evaluator = GridworldContinuousEvaluator(environment, False, DISCOUNT,
                                                 False, samples)
        tdps = environment.preprocess_samples(samples, self.minibatch_size)

        for tdp in tdps:
            trainer.train_numpy(tdp, None)
        evaluator.evaluate(predictor)

        self.assertLess(evaluator.evaluate(predictor), 0.15)

Esempio n. 3

Mostra file

    def test_trainer_sarsa_enum_factorized(self):
        environment = GridworldContinuousEnum()
        samples = environment.generate_samples(500000, 1.0, DISCOUNT)
        trainer = self.get_sarsa_trainer(
            environment, self.get_sarsa_parameters_factorized())
        predictor = trainer.predictor()
        evaluator = GridworldContinuousEvaluator(environment, False, DISCOUNT,
                                                 False, samples)
        tdps = environment.preprocess_samples(samples, self.minibatch_size)

        for tdp in tdps:
            trainer.train(tdp)

        predictor = trainer.predictor()
        evaluator.evaluate(predictor)

        self.assertLess(evaluator.evaluate(predictor), 0.15)

Esempio n. 4

Mostra file

    def test_trainer_sarsa_enum(self):
        environment = GridworldContinuousEnum()
        samples = environment.generate_samples(150000, 1.0)
        trainer = self.get_sarsa_trainer(environment)
        predictor = trainer.predictor()
        evaluator = GridworldContinuousEvaluator(environment, False, DISCOUNT,
                                                 False, samples)
        tdps = environment.preprocess_samples(samples, self.minibatch_size)

        for tdp in tdps:
            tdp.rewards = tdp.rewards.flatten()
            tdp.not_terminals = tdp.not_terminals.flatten()
            trainer.train(tdp)

        predictor = trainer.predictor()
        evaluator.evaluate(predictor)

        self.assertLess(evaluator.evaluate(predictor), 0.15)

Esempio n. 5

Mostra file

File: test_gridworld_continuous.py Progetto: framework-learner/BlueWhale

 def envs():
     return [
         (GridworldContinuous(), ),
         (GridworldContinuousEnum(), ),
     ]

Esempio n. 6

Mostra file

File: test_gridworld_continuous.py Progetto: keithmgould/BlueWhale

 def envs_and_evaluators():
     return [
         (GridworldContinuous(), GridworldContinuousEvaluator),
         (GridworldContinuousEnum(), GridworldContinuousEnumEvaluator),
     ]