Python Agent.Brain Examples

Programming Language: Python

Class/Type: Agent

Method/Function: Brain

Examples at hotexamples.com: 2

Python Agent.Brain - 2 examples found. These are the top rated real world Python examples of Agent.Brain from package cleanrl extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

Agent(30)

AlphaBetaAgent(6)

AgentFactory(4)

ACPGAg(2)

Chooser(2)

Brain(2)

CFAgent(2)

Agent_PG(1)

consumption_value_low(1)

runAwayBehaviour(1)

production_value(1)

placeall(1)

make(1)

deserializeAgent(1)

createAgentList(1)

consumption_value_high(1)

AgentTool(1)

CopyToTargetNetwork(1)

ActionValue(1)

AbsorbSample(1)

AgentQLearn(1)

BS_Agent(1)

AlphabetaAgent(1)

scriptedBehaviour(1)

Example #1

Show file

File: main.py Project: kingdy2002/A3C

def main():
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    device = torch.device('cpu')
    num_action = 2
    num_state = 4
    num_process = 5

    global_Actor = NeuralNet.ActorNet(inputs=num_state,
                                      outputs=num_action,
                                      num_hidden_layers=2,
                                      hidden_dim=8).to(device)
    #summary(global_Actor, input_size=(10,num_state))
    global_Critic = NeuralNet.CriticNet(inputs=num_state,
                                        outputs=1,
                                        num_hidden_layers=2,
                                        hidden_dim=8).to(device)
    #summary(global_Critic, input_size=(10,num_state))
    batch_size = 64
    GAMMA = 0.95
    max_episodes = 5000
    max_step = 1000
    global_Actor.share_memory()
    global_Critic.share_memory()

    processes = []
    processes_socket = []
    processes_agent = []
    mp.set_start_method('spawn')
    print("MP start method:", mp.get_start_method())

    ip = '110.76.78.109'
    port = 1111
    for rank in range(num_process):
        processes_socket.append(0)
        processes_socket[rank] = ClientSocket.MySocket(port, 'f', 'ffff?f')
        processes_agent.append(0)
        processes_agent[rank] = Agent.Brain(GlobalActorNet=global_Actor,
                                            GlobalCriticNet=global_Critic,
                                            device=device,
                                            socket=processes_socket[rank],
                                            num_action=num_action,
                                            max_episodes=max_episodes,
                                            max_step=max_step,
                                            batch_size=batch_size,
                                            GAMMA=GAMMA)
        p = mp.Process(target=processes_agent[rank].train, args=())
        p.start()
        processes.append(p)

    for p in processes:
        p.join()

Example #2

Show file

def main():

    processes = []
    processes_socket = []
    processes_agent = []

    device = torch.device('cpu')
    num_action = 2
    num_state = 4
    num_process = 1

    batch_size = 64
    GAMMA = 0.95
    max_episodes = 5000
    max_step = 1000

    global_Actor = NeuralNet.ActorNet(inputs=num_state,
                                      outputs=num_action,
                                      num_hidden_layers=2,
                                      hidden_dim=8).to(device)
    global_Critic = NeuralNet.CriticNet(inputs=num_state,
                                        outputs=1,
                                        num_hidden_layers=2,
                                        hidden_dim=8).to(device)

    dic = torch.load(f"D:/modelDict/actor/modelDict.pt")
    global_Actor.load_state_dict(torch.load("D:/modelDict/actor/modelDict.pt"))
    global_Critic.load_state_dict(
        torch.load("D:/modelDict/critic/modelDict.pt"))

    port = 1111
    for rank in range(num_process):
        processes_socket.append(0)
        processes_socket[rank] = ClientSocket.MySocket(port, 'f', 'ffff?f')
        processes_agent.append(0)
        processes_agent[rank] = Agent.Brain(GlobalActorNet=global_Actor,
                                            GlobalCriticNet=global_Critic,
                                            device=device,
                                            socket=processes_socket[rank],
                                            num_action=num_action,
                                            max_episodes=max_episodes,
                                            max_step=max_step,
                                            batch_size=batch_size,
                                            GAMMA=GAMMA)
        p = mp.Process(target=processes_agent[rank].test,
                       args=(global_Actor, global_Critic))
        p.start()
        processes.append(p)

    for p in processes:
        p.join()