Python Agent.build 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: agents

클래스/타입: Agent

메소드/함수: build

hotexamples.com에서의 예제들: 1

Python Agent.build - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 agents.Agent.build에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Agent(30)

run_episode(4)

act(4)

__init__(3)

name(3)

get_move(3)

eval(3)

mark(2)

move(2)

get_action(2)

from_conf(2)

reset(2)

learn(2)

test(2)

build_trajectories(2)

ships(1)

log_activity_active(1)

log_activity_idle(1)

update_t_pref(1)

update_belief(1)

train_model(1)

train(1)

on(1)

parameters(1)

ppo_update(1)

precepts(1)

symbol(1)

set_train_mode(1)

stop(1)

preference_position(1)

step(1)

program(1)

state(1)

load_curve_certificate(1)

start(1)

sample_duration_current_state(1)

save(1)

set_current_activity_end(1)

reset_graph_info(1)

input_vector(1)

load(1)

choose_state(1)

ac_model(1)

add_actuator(1)

add_event(1)

add_id(1)

add_sensor(1)

append_sample(1)

bombs_left(1)

예제 #1

파일 보기

파일: CachedExperience.py 프로젝트: squirrelinhell/meta-ml

    def __init__(self, world, agents, test_each=0, max_batch=16):
        import numpy as np

        if not isinstance(agents, list):
            agents = [agents]

        self.get_observation_shape = lambda: world.obs_shape
        self.get_action_shape = lambda: world.act_shape
        self.get_reward_shape = lambda: world.rew_shape

        cache = []

        def trajectories(agent, n):
            trajs = world.trajectories(agent, n)
            for t in trajs:
                cache.append(t)
            return trajs

        self.trajectories = trajectories

        def test(agent):
            mandalka.evaluate(agent)
            todo = test_each
            while todo >= 1:
                batch = min(max_batch, todo)
                trajectories(agent, n=batch)
                todo -= batch

        for i, a in enumerate(agents):
            test(Agent.build(a, self, i))

        rng = np.random.RandomState()

        def trajectories(_, n):
            n = int(n)
            assert n >= 1
            idx = rng.choice(len(cache), size=n)
            # TODO: this is unsafe, values could be modified outside
            return [cache[i] for i in idx]

        self.trajectories = trajectories
        self.num_trajectories = lambda: len(cache)