Python Agent.cuda 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: src.agent

클래스/타입: Agent

메소드/함수: cuda

hotexamples.com에서의 예제들: 1

Python Agent.cuda - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 src.agent.Agent.cuda에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Agent(30)

act(11)

attach_observer(5)

get_parameters_from_file(4)

get_action(3)

load(2)

learn(2)

ep_end(2)

evaluate(2)

get_total_profit(2)

load_dict(1)

is_memory_empty(1)

initialize_total_assets(1)

generate(1)

get_nodes_for_graph(1)

experience_replay(1)

eval_act(1)

cuda(1)

choose_action(1)

bonus_reward(1)

add_data(1)

load_model(1)

예제 #1

파일 보기

파일: main.py 프로젝트: hrukalive/pg_pytorch

def main():
    print ("note: 'ulimit -Sn 1024' if Errno 24")
    parser = argparse.ArgumentParser()
    parser.add_argument('--env', default='CartPole-v1')
    parser.add_argument('--seed', type=int, default=417)
    parser.add_argument('--n-timesteps', type=int, default=1e5)
    parser.add_argument('--gamma', type=float, default=0.99)
    parser.add_argument('--max-kl', type=float, default=1e-2)
    parser.add_argument('--log-interval', type=int, default=1e4)
    parser.add_argument('--save-path', default=None)
    parser.add_argument('--batch-size', type=int, default=1)
    parser.add_argument('--cuda', type=bool, default=False)
    parser.add_argument('--update-rule', default='A2C')
    args = parser.parse_args()

    if args.cuda:
        assert torch.cuda.is_available(), 'No available cuda devices'

    envs = [gym.make(args.env) for _ in range(args.batch_size)]
    set_seeds(envs, args.seed, args.cuda)

    agent = Agent(envs[0].observation_space, envs[0].action_space)
    if args.cuda:
        agent.cuda()

    rets = learn(agent, envs, args.update_rule, cuda=args.cuda, n_timesteps=args.n_timesteps, gamma=args.gamma,
          log_interval=args.log_interval, max_kl=args.max_kl)

    torch.save(rets, "./out/{}_{}".format(args.env, args.update_rule))

    if not (args.save_path is None):
        torch.save(agent.state_dict(), args.save_path)