Python Experiment.run 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: rlpy.Experiments

클래스/타입: Experiment

메소드/함수: run

hotexamples.com에서의 예제들: 4

Python Experiment.run - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 rlpy.Experiments.Experiment.run에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Experiment(30)

run(2)

plot(1)

예제 #1

파일 보기

파일: main.py 프로젝트: qianweisheng/sdrl

def runExperiment(opt, visualize_steps, visualize_learning, visualize_performance, q):
    # Experiment要在子进程中创建，不能直接传创建好的对象（会影响logger的正常工作）
    exp = Experiment(**opt)

    # 给logger加handler
    # 子进程的log->MemoryHandler->OutputHandler-> queue <-ExpOutputDialog.receive->QTextEdit
    # log通过queue在进程间传递，主线程通过thread接收queue中的新消息
    from logging.handlers import MemoryHandler
    handler = MemoryHandler(capacity=1024, flushLevel=logging.INFO, target=OutputHandler(q))
    exp.logger.addHandler(handler)

    exp.run(visualize_steps=visualize_steps,  # should each learning step be shown?
           visualize_learning=visualize_learning,  # show policy / value function?
           visualize_performance=visualize_performance)  # show performance runs?
    exp.plot()

예제 #2

파일 보기

파일: goalpaths.py 프로젝트: BerkeleyAutomation/consumable-irl

	def __init__(self, domain, representation, policy,steps=100000):
		
		opt = {}
		opt["domain"] = domain
		# Agent
		opt["agent"] = Q_Learning(representation=representation, policy=policy,
                       discount_factor=domain.discount_factor,
                       initial_learn_rate=0.1,
                       learn_rate_decay_mode="boyan", boyan_N0=100,
                       lambda_=0.)
    
		opt["checks_per_policy"] = 10
		opt["max_steps"] = steps
		opt["num_policy_checks"] = 20
		experiment = Experiment(**opt)
		experiment.run()
		self.policy = opt["agent"].policy
		self.domain = domain

예제 #3

파일 보기

def runExperiment(opt, visualize_steps, visualize_learning,
                  visualize_performance, q):
    # Experiment要在子进程中创建，不能直接传创建好的对象（会影响logger的正常工作）
    exp = Experiment(**opt)

    # 给logger加handler
    # 子进程的log->MemoryHandler->OutputHandler-> queue <-ExpOutputDialog.receive->QTextEdit
    # log通过queue在进程间传递，主线程通过thread接收queue中的新消息
    from logging.handlers import MemoryHandler
    handler = MemoryHandler(capacity=1024,
                            flushLevel=logging.INFO,
                            target=OutputHandler(q))
    exp.logger.addHandler(handler)

    exp.run(
        visualize_steps=visualize_steps,  # should each learning step be shown?
        visualize_learning=visualize_learning,  # show policy / value function?
        visualize_performance=visualize_performance)  # show performance runs?
    exp.plot()

예제 #4

파일 보기

    def __init__(self, domain, representation, policy, steps=100000):

        opt = {}
        opt["domain"] = domain
        # Agent
        opt["agent"] = Q_Learning(representation=representation,
                                  policy=policy,
                                  discount_factor=domain.discount_factor,
                                  initial_learn_rate=0.1,
                                  learn_rate_decay_mode="boyan",
                                  boyan_N0=100,
                                  lambda_=0.)

        opt["checks_per_policy"] = 10
        opt["max_steps"] = steps
        opt["num_policy_checks"] = 20
        experiment = Experiment(**opt)
        experiment.run()
        self.policy = opt["agent"].policy
        self.domain = domain