예제 #1
0
파일: rssm.py 프로젝트: jsikyoon/dreamer-1
 def divergence_from_states(self, lhs, rhs, mask=None):
   lhs = self.dist_from_state(lhs, mask)
   rhs = self.dist_from_state(rhs, mask)
   divergence = tfd.kl_divergence(lhs, rhs)
   if mask is not None:
     divergence = tools.mask(divergence, mask)
   return divergence
예제 #2
0
파일: rssm.py 프로젝트: jsikyoon/dreamer-1
 def dist_from_state(self, state, mask=None):
   if mask is not None:
     stddev = tools.mask(state['stddev'], mask, value=1)
   else:
     stddev = state['stddev']
   dist = tfd.MultivariateNormalDiag(state['mean'], stddev)
   return dist