Python FeatureData.repeat_interleave Beispiele

Programmiersprache: Python

Namespace / Paketname: reagent.types

Klasse / Typ: FeatureData

Methode / Funktion: repeat_interleave

Beispiele auf hotexamples.com: 4

Python FeatureData.repeat_interleave - 4 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die reagent.types.FeatureData.repeat_interleave, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

dim(4)

repeat_interleave(4)

FeatureData(2)

size(2)

float(1)

get_tiled_batch(1)

Beispiel #1

Datei anzeigen

Datei: slate_q_trainer.py Projekt: hermes2k/ReAgent

 def _get_unmasked_q_values(self, q_network, state: rlt.FeatureData,
                            slate: rlt.DocList) -> torch.Tensor:
     """ Gets the q values from the model and target networks """
     batch_size, slate_size, _ = slate.float_features.shape
     # TODO: Probably should create a new model type
     return q_network(state.repeat_interleave(slate_size, dim=0),
                      slate.as_feature_data()).view(batch_size, slate_size)

Beispiel #2

Datei anzeigen

 def _get_unmask_q_values(
     self,
     q_network,
     state: rlt.FeatureData,
     action: rlt.PreprocessedSlateFeatureVector,
 ) -> torch.Tensor:
     batch_size, slate_size, _ = action.float_features.shape
     return q_network(
         state.repeat_interleave(slate_size, dim=0),
         action.as_preprocessed_feature_vector(),
     ).view(batch_size, slate_size)

Beispiel #3

Datei anzeigen

    def score(preprocessed_obs: rlt.FeatureData) -> torch.Tensor:
        tiled_state = preprocessed_obs.repeat_interleave(repeats=num_actions,
                                                         axis=0)

        actions = rlt.FeatureData(float_features=torch.eye(num_actions))

        q_network.eval()
        scores = q_network(tiled_state.state, actions).view(-1, num_actions)
        assert (
            scores.size(1) == num_actions
        ), f"scores size is {scores.size(0)}, num_actions is {num_actions}"
        q_network.train()
        return F.log_softmax(scores, dim=-1)

Beispiel #4

Datei anzeigen

Datei: slate_q_scorer.py Projekt: zachkeer/ReAgent

    def score(state: rlt.FeatureData) -> torch.Tensor:
        tiled_state = state.repeat_interleave(repeats=num_candidates, axis=0)
        candidate_docs = state.candidate_docs
        assert candidate_docs is not None
        actions = candidate_docs.as_feature_data()

        q_network.eval()
        scores = q_network(tiled_state, actions).view(-1, num_candidates)
        q_network.train()

        select_prob = F.softmax(candidate_docs.value, dim=1)
        assert select_prob.shape == scores.shape

        return select_prob * scores