Ejemplo n.º 1
0
 def input_schema(self) -> LossInputSchema:
     return LossInputSchema(head_outputs=['new_policy_probs'],
                            agent_inputs=[
                                'actions', 'old_policy_probs',
                                'clip_param_rescaler'
                            ],
                            targets=['advantages'])
Ejemplo n.º 2
0
 def input_schema(self) -> LossInputSchema:
     return LossInputSchema(head_outputs=['pred'],
                            agent_inputs=[],
                            targets=['target'])
Ejemplo n.º 3
0
 def input_schema(self) -> LossInputSchema:
     return LossInputSchema(head_outputs=['new_policy_values'],
                            agent_inputs=['old_policy_values'],
                            targets=['target_values'])