Python NeuralNetwork.DuelingNetwork 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: NeuralNetwork

클래스/타입: NeuralNetwork

메소드/함수: DuelingNetwork

hotexamples.com에서의 예제들: 1

Python NeuralNetwork.DuelingNetwork - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 NeuralNetwork.NeuralNetwork.DuelingNetwork에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

NeuralNetwork(30)

__init__(9)

MSE_epoch(3)

transform(2)

Cleanup(2)

teach(2)

GADEnet(2)

L_model_forward(2)

classification_test(2)

MSE(2)

createNetwork(1)

empirical_error(1)

getAlpha(1)

getClassification(1)

get_auc(1)

gradient_descent(1)

input(1)

initTheta(1)

loadDataset(1)

normalize(1)

propagateBack(1)

setAlpha(1)

set_momentum(1)

simulate(1)

threshold(1)

training(1)

classifyImage(1)

BackwardPropagate(1)

_encode_labels(1)

Initialize(1)

DNA(1)

DuelingNetwork(1)

Expected(1)

Fit(1)

FowardPropagate(1)

GADEvec(1)

InitActivation(1)

InitializeInputs(1)

_add_bias_unit(1)

Loadmodel(1)

MAE(1)

Predict(1)

R2(1)

RMSE(1)

SGD(1)

Savemodel(1)

Train(1)

Training(1)

예제 #1

파일 보기

class DeepQLearning(object):
    
    def __init__(self,expsize=10000):
        self.targetNN=NeuralNetwork()
        self.mainNN=NeuralNetwork()
        self.exp=ExperienceReplay(expsize)
        self.batch_size=512
        self.Epsilon=0.9
        self.Lambda=0.9
        self.map,self.map_=self.makemap(10)

    def start(self):
        self.mainNN.DuelingNetwork()
        self.targetNN.DuelingNetwork()

    def load(self,name):
        self.targetNN.Loadmodel(name)
        self.mainNN.Loadmodel(name)

    def saveModel(self,name):
        self.targetNN.Savemodel(name)


    def getNext(self,situation,numlist,israndom):
        ran=(random.uniform(0,1)>self.Epsilon)
        if ran or israndom:
            rannum=random.sample(numlist,1)
            print(rannum[0][0],rannum[0][1],rannum[0][2],rannum[0][3])
            max_index=self.map_[rannum[0][0],rannum[0][1],rannum[0][2],rannum[0][3]]
        else:
            index=self.mainNN.model.predict(situation)
            max_index=index.argmax()
        return self.getMove(max_index)


    def getMove(self,index):
        num=int(index)
        if num<2940:
            z=self.map[num]
            return num,z[0],z[1],z[2],z[3]            
        elif num>=2940:
            z=-1
            numm=num-2940
            x=int(numm/10)
            y=numm%10
            return num,x,y,x,y
            

    def saveEXP(self,fistS,action,reward,done,nextS):
        self.exp.add(fistS,action,reward,done,nextS)
        
    def learn(self):
        if self.exp.tree.flag:
            return
        fistS,actrew,nextS,idxl,isweight=self.exp.getDate(self.batch_size)
        qtarget=[]
        for i in nextS:
            targetv=self.targetNN.model.predict(i)
            mainv=self.mainNN.model.predict(i)
            for tv,mv in zip(targetv,mainv):
                v=tv[argmax(mv)]
                qtarget.append(v)
        k=0
        ans=[]
        errors=empty(self.batch_size)
        for i,j,done in actrew:
            r=zeros(3040)
            r[i]+=j+(1-done)*self.Lambda*qtarget[k]
            ans.append(r)
            errors[k]=abs(mainv[0][i]-r[i])
            k+=1
        self.mainNN.Training(fistS,ans,isweight,self.batch_size)
        self.exp.batch_updata(idxl,errors)

    def copy(self):
        self.targetNN.copy(self.mainNN.model.get_weights())

    def getmWeight(self):
        return self.mainNN.model.get_weights()

    def copym(self,mn):
        self.mainNN.copy(mn)

    def makemap(self,n):
        ans=[]
        for i in range(n):
            for j in range(n):
                for k in range(1,n):
                    if i<n and i>=0 and j+k<n and j+k>=0:
                        ans.append([i,j,i,j+k])
                for k in range(1,n):
                    if i+k<n and i+k>=0 and j+k<n and j+k>=0:
                        ans.append([i,j,i+k,j+k])
                for k in range(1,n):
                    if i+k<n and i+k>=0 and j<n and j>=0:
                        ans.append([i,j,i+k,j])
                for k in range(1,n):
                    if i+k<n and i+k>=0 and j-k<n and j-k>=0:
                        ans.append([i,j,i+k,j-k])
                for k in range(1,n):
                    if i<n and i>=0 and j-k<n and j-k>=0:
                        ans.append([i,j,i,j-k])
                for k in range(1,n):
                    if i-k<n and i-k>=0 and j-k<n and j-k>=0:
                        ans.append([i,j,i-k,j-k])
                for k in range(1,n):
                    if i-k<n and i-k>=0 and j<n and j>=0:
                        ans.append([i,j,i-k,j])
                for k in range(1,n):
                    if i-k<n and i-k>=0 and j+k<n and j+k>=0:
                        ans.append([i,j,i-k,j+k])
        ans_=dict()
        k=0
        for i in ans:
            ans_[i[0],i[1],i[2],i[3]]=k
            k+=1
        for i in range(n):
            for j in range(n):
                ans_[i,j,i,j]=k
                k+=1
        return ans,ans_