Python MyDict.wakachi 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: mydict

클래스/타입: MyDict

메소드/함수: wakachi

hotexamples.com에서의 예제들: 3

Python MyDict.wakachi - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 mydict.MyDict.wakachi에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

MyDict(18)

key(4)

wakachi(3)

countDictWords(2)

loadict(2)

words2ids(2)

loadtext(1)

mark(1)

newLayer(1)

put(1)

savedict(1)

예제 #1

파일 보기

파일: analog.py 프로젝트: cellhone/analog

 
 arg1 = sys.argv[1] if len(sys.argv) == 2 else None
 ## 学習 ##
 if arg1 == 'train':
     print "training...parsing..."
     ## エラー定義の読み込み
     with open('error.json', 'r') as f:
         errjson = json.load(f, "utf-8")
     for erritem in errjson:
         labellist.append(erritem)
         msgidlist = []
         for msgtxt in erritem['message']:
             ## wakachiで処理するため明示的にunicodeにする
             ## ex) cmapeerdが停止したためプロセスを再起動します
             w = u'' + msgtxt
             words = dict.wakachi(w.encode('utf-8'))
             ids = dict.words2ids(words)
             ## ex) [113, 63, 11, 9, 13, 104, 6, 7, 66, 8, 9, 10]
             #y = train.predict(ids)
             y = train.predict(ids[::-1])
             wordid = y.data.argmax(1)[0]    ## ex) 84
             msgidlist.append(wordid)
             
         analizeRnnInputList.append(msgidlist)
         pp(erritem)
         pp(msgidlist)
     ## ex) [[65,66],[40,86,84]]
     pp(analizeRnnInputList)
     
     ## 採用メッセージリスト保存
     ## [[83], [65, 66]...] こうなっているのを [83,65,66...]にしてユーニークにする

예제 #2

파일 보기

파일: model.py 프로젝트: cellhone/analog

    def predict(self, data):
        inmsg = data.split('\n')
        #inmsg = ['エージェントが可能な変更を行った後動作を開始しました']

        log.debug('predict: predict　data=%s', inmsg)
        dictfile = self.model_path + '/dict.dat'
        configFile = self.model_path + '/analog.ini'
        dict = MyDict(dictfile)
        dict.loadict()
        print 'dict count: %d' % dict.countDictWords()

        ## 採用メッセージID
        acceptid = self.fload(self.model_path + '/accept.dat')
        print '**accept id:'
        print acceptid

        ## エラー定義の読み込み
        with open(self.model_path + '/error.json', 'r') as f:
            errjson = json.load(f, "utf-8")

        ## RNNメッセージID化
        vocab = 10000
        dim = 100
        y = 94
        train = Trainer(vocab, dim, y)
        train.load(self.model_path + '/train')

        labellist = []  ## ラベル一覧(出力)
        #msglist = []    ## メッセージ一覧（無視リスト作成のため使用メッセージを保存）
        analizeRnnInputList = []
        analizeRnnLabelList = []
        msgidlist = []
        for msgtxt in inmsg:
            ## wakachiで処理するため明示的にunicodeにする
            ## ex) cmapeerdが停止したためプロセスを再起動します
            #w = u'' + msgtxt
            #words = dict.wakachi(w.encode('utf-8'))
            words = dict.wakachi(msgtxt)
            ids = dict.words2ids(words)
            ## 改行のみはスキップ
            if ids == []:
                continue
            ## ex) [113, 63, 11, 9, 13, 104, 6, 7, 66, 8, 9, 10]
            y = train.predict(ids[::-1])
            wordid = y.data.argmax(1)[0]  ## ex) 84

            ## エラーリストにあるメッセージ以外は処理にしない
            if wordid in acceptid:
                msgidlist.append(wordid)
            else:
                print 'not accept id:%d, msg:%s' % (wordid, msgtxt)
                continue
            print '** msg prdict %d, %2f' % (wordid, y.data[0][wordid]
                                             )  ## 選択されたidの確率表示
        pp(inmsg)
        pp(msgidlist)

        ## 対象メッセージが無い
        if msgidlist == []:
            result = [{'score': 100, 'id': None, 'label': None}]
            return result

        ## エラーケースの予測
        config = ConfigParser.SafeConfigParser()
        config.read(configFile)

        dim_in = config.getint('analize', 'dim_in')
        dim_mid = config.getint('analize', 'dim_mid')
        dim_out = config.getint('analize', 'dim_out')
        """
        train = AnazlizeTrainer(dim_in, dim_mid, dim_out)
        train.load(self.model_path + '/train_analize')
        y = train.predict(msgidlist[::-1])
        print y.data.argmax(1)[0]
        rank = y.data.argsort()[0]
        uprank = map(int, rank[::-1])
        print uprank
        #print y.data[0]
        """

        train = AnazlizeTrainer(dim_in, dim_mid, dim_out)
        train.load(self.model_path + '/train_analize')
        #y = train.predict(msgidlist[::-1])

        targetlist = msgidlist
        resultlist = np.zeros(dim_out)  ## 確率結果の最大値を格納する配列
        print resultlist
        for i in range(len(targetlist)):
            target = targetlist[i:]
            y = train.predict(target[::-1])
            print target
            print y.data[0]
            for i in range(len(y.data[0])):
                if y.data[0][i] > resultlist[i]:
                    resultlist[i] = y.data[0][i]

        print resultlist
        #print y.data.argmax(1)[0]
        #rank = y.data.argsort()[0]
        rank = resultlist.argsort()
        uprank = map(int, rank[::-1])
        print uprank
        #print y.data[0]

        result = []
        for i in uprank:
            print '%d, %2f' % (i, resultlist[i])
            item = {
                'score': round(float(resultlist[i]) * 100, 2),
                'id': i,
                'label': errjson[i]['label']
            }
            result.append(item)

        return result

예제 #3

파일 보기

            print loss.data
            train.save('train')

    ## 予測
    elif arg1 == 'predict':
        print 'predict...'
        ## 12,"システム,管理,プロセス,を,起動,し,ます","35,5,6,7,8,9,10"
        #ids = [35,5,6,7,8,9,10]
        dictfile = 'dict.dat'
        dict = MyDict(dictfile)
        dict.loadict()

        #text = 'システム管理プロセスを起動します'
        #text = 'クラスターサービスの状態がstarted以外に変更されました'
        text = 'エージェントが可能な変更を行った後動作を開始しました'
        words = dict.wakachi(text)
        ids = dict.words2ids(words)
        pp(words)
        print ids

        vocab = 10000
        dim = 100
        y = 94
        train = Trainer(vocab, dim, y)
        train.load('train')
        print ids
        y = train.predict(ids[::-1])
        print y.data.argmax(1)[0]
        rank = y.data.argsort()[0]
        uprank = map(int, rank[::-1])
        print uprank