Esempi in Python per ModelBuilder.build_forward_model

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: model_builder

Classe/tipologia: ModelBuilder

Metodo/funzione: build_forward_model

Esempi su hotexamples.com: 1

ModelBuilder.build_forward_model in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per model_builder.ModelBuilder.build_forward_model, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

ModelBuilder(29)

load_model_weights(3)

fit_model(3)

accuracy_score(2)

build(2)

build_train_test_models(2)

build_model(2)

decode(1)

create_full_model(1)

create_model(1)

evaluate(1)

encode(1)

encoder_output_size(1)

contruct_model(1)

get(1)

get_checkpoint(1)

get_latest_save_path(1)

create_from_model_name(1)

BuildNetFlowModel(1)

compile_model(1)

compile(1)

BuildWinlogEventIdModel(1)

build_trainable_model(1)

build_inverse_model(1)

build_graph(1)

build_generator(1)

build_forward_model(1)

build_f(1)

build_dqn_model(1)

build_discriminator(1)

build_all(1)

check_prediction(1)

Esempio n. 1

Mostra file

File: agent_dqn.py Progetto: marisancans/reinforcement-learning-with-curiosity

    def __init__(self, args, name):
        super().__init__()

        # --------- AGENT ---------------
        self.name = name
        self.check_args(args)
        self.args = args

        # --------- ENVIROMENT ----------
        self.env = gym.make(self.args.env_name)
        self.current_features_sequence = None  # Gets set in self.reset_env(). This holds encoded sequence if enabled

        # --------- ENV STATE ---------------
        self.n_states = self.env.observation_space.shape[0]
        self.states_sequence = deque(maxlen=self.args.n_sequence)

        self.state_max_val = self.env.observation_space.low.min()
        self.state_min_val = self.env.observation_space.high.max()
        self.n_actions = self.env.action_space.n
        self.epsilon = 1.0

        # --------- MODELS --------------
        if self.args.encoder_type != 'nothing':
            self.feature_extractor = FeatureExtractor(self.args, self.n_states)

        builder = ModelBuilder(self.args, self.n_states, self.n_actions)

        if self.args.encoder_type == 'conv':
            builder.encoder_output_size = self.feature_extractor.encoder_output_size

        self.dqn_model = builder.build_dqn_model()
        self.target_model = builder.build_dqn_model()

        if self.args.is_curiosity:
            self.inverse_model = builder.build_inverse_model()
            self.forward_model = builder.build_forward_model()

        # --------   OPTIMIZER AND LOSS  ----
        if self.args.is_curiosity:
            params = list(self.inverse_model.parameters()) + list(
                self.feature_extractor.encoder.parameters()) + list(
                    self.forward_model.parameters()) + list(
                        self.dqn_model.parameters())
        else:
            params = self.dqn_model.parameters()

        self.optimizer = torch.optim.Adam(params=params,
                                          lr=self.args.learning_rate)

        self.dqn_model_loss_fn = nn.MSELoss()
        self.inverse_model_loss_fn = nn.MSELoss()

        # --------- INTERNAL STATE -------
        self.current_episode = 0
        self.total_steps = 0  # in all episodes combined
        self.current_step = 0  # only in current episode
        self.memory = Memory(capacity=self.args.memory_size,
                             is_per=self.args.is_prioritized)

        # ----- TRAINING BUFFER --------
        self.loss_dqn = []
        self.ers = []

        if self.args.is_curiosity:
            self.loss_inverse = []
            self.cos_distance = []
            self.loss_combined = []

        # ----- EPISODE BUFFER  --------
        self.e_loss_dqn = []
        self.e_reward = []

        if self.args.is_curiosity:
            self.e_loss_inverse = []
            self.e_cos_distance = []
            self.e_loss_combined = []

        self.update_target()