Python apply_grads_mom_rmsprop 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: utils.hogupdatemv

메소드/함수: apply_grads_mom_rmsprop

hotexamples.com에서의 예제들: 2

Python apply_grads_mom_rmsprop - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 utils.hogupdatemv.apply_grads_mom_rmsprop에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: actor_learner.py 프로젝트: Wanjun0511/tensorflow-rl

    def _apply_gradients_to_shared_memory_vars(self, grads, shared_vars):
        opt_st = self.opt_st
        self.flat_grads = np.empty(shared_vars.size, dtype=ctypes.c_float)

        #Flatten grads
        offset = 0
        for g in grads:
            self.flat_grads[offset:offset + g.size] = g.reshape(-1)
            offset += g.size
        g = self.flat_grads

        shared_vars.step.value += 1
        T = shared_vars.step.value

        if self.optimizer_type == "adam" and self.optimizer_mode == "shared":
            p = np.frombuffer(shared_vars.vars, ctypes.c_float)
            p_size = shared_vars.size
            m = np.frombuffer(opt_st.ms, ctypes.c_float)
            v = np.frombuffer(opt_st.vs, ctypes.c_float)
            opt_st.lr.value = 1.0 * opt_st.lr.value * (1 - self.b2**T)**0.5 / (
                1 - self.b1**T)

            apply_grads_adam(m, v, g, p, p_size, opt_st.lr.value, self.b1,
                             self.b2, self.e)

        elif self.optimizer_type == "adamax" and self.optimizer_mode == "shared":
            beta_1 = .9
            beta_2 = .999
            lr = opt_st.lr.value

            p = np.frombuffer(shared_vars.vars, ctypes.c_float)
            p_size = shared_vars.size
            m = np.frombuffer(opt_st.ms, ctypes.c_float)
            u = np.frombuffer(opt_st.vs, ctypes.c_float)

            apply_grads_adamax(m, u, g, p, p_size, lr, beta_1, beta_2, T)

        else:  #local or shared rmsprop/momentum
            lr = self.decay_lr()
            if (self.optimizer_mode == "local"):
                m = opt_st
            else:  #shared
                m = np.frombuffer(opt_st.vars, ctypes.c_float)

            p = np.frombuffer(shared_vars.vars, ctypes.c_float)
            p_size = shared_vars.size
            _type = 0 if self.optimizer_type == "momentum" else 1

            apply_grads_mom_rmsprop(m, g, p, p_size, _type, lr, self.alpha,
                                    self.e)

예제 #2

파일 보기

파일: actor_learner.py 프로젝트: gitter-badger/tensorflow-rl

    def _apply_gradients_to_shared_memory_vars(self, grads, opt_st):
            #Flatten grads
            offset = 0
            for g in grads:
                self.flat_grads[offset:offset + g.size] = g.reshape(-1)
                offset += g.size
            g = self.flat_grads
            
            if self.optimizer_type == "adam" and self.optimizer_mode == "shared":
                p = np.frombuffer(self.learning_vars.vars, ctypes.c_float)
                p_size = self.learning_vars.size
                m = np.frombuffer(opt_st.ms, ctypes.c_float)
                v = np.frombuffer(opt_st.vs, ctypes.c_float)
                T = self.global_step.value() 
                opt_st.lr.value =  1.0 * opt_st.lr.value * (1 - self.b2**T)**0.5 / (1 - self.b1**T) 
                
                apply_grads_adam(m, v, g, p, p_size, opt_st.lr.value, self.b1, self.b2, self.e)

            elif self.optimizer_type == "adamax" and self.optimizer_mode == "shared":
                beta_1 = .9
                beta_2 = .999
                lr = opt_st.lr.value

                p = np.frombuffer(self.learning_vars.vars, ctypes.c_float)
                p_size = self.learning_vars.size
                m = np.frombuffer(opt_st.ms, ctypes.c_float)
                u = np.frombuffer(opt_st.vs, ctypes.c_float)
                T = self.global_step.value()

                apply_grads_adamax(m, u, g, p, p_size, lr, beta_1, beta_2, T)
                    
            else: #local or shared rmsprop/momentum
                lr = self.decay_lr()
                if (self.optimizer_mode == "local"):
                    m = opt_st
                else: #shared 
                    m = np.frombuffer(opt_st.vars, ctypes.c_float)
                
                p = np.frombuffer(self.learning_vars.vars, ctypes.c_float)
                p_size = self.learning_vars.size
                _type = 0 if self.optimizer_type == "momentum" else 1
                
                #print "BEFORE", "RMSPROP m", m[0], "GRAD", g[0], self.flat_grads[0], self.flat_grads2[0]
                apply_grads_mom_rmsprop(m, g, p, p_size, _type, lr, self.alpha, self.e)