Python CEDict 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: cedict

클래스/타입: CEDict

hotexamples.com에서의 예제들: 9

Python CEDict - 9개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 cedict.CEDict에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

CEDict(9)

자주 사용되는 메소드들

CEDict (9)

예제 #1

파일 보기

def classify_translate_cerelation(pTrains,pTests):
    dict=CEDict()
    pmi=PMI()
    
    trains=[]
    tests=[]
    
    for label,p in pTrains:
        words=getTranlateFeaturesCERelation(p,dict,pmi)
        trains.append(CDocument(label,words))
    for label,p in pTests:
        words=getTranlateFeaturesCERelation(p,dict,pmi)
        tests.append(CDocument(label,words))
    
    return me_classify(trains,tests)

예제 #2

파일 보기

def blp_translate_simple(pTrains,pTests):
    dict=CEDict()
    
    trains=[]
    tests=[]
    
    for label,p in pTrains:
        words=getTranlateFeatures(p,dict)
        trains.append(CDocument(label,words))
    for label,p in pTests:
        words=getTranlateFeatures(p,dict)
        tests.append(CDocument(label,words))
        
    blp=BLP(trains+tests)
    blp.LP_Classify(trains,tests)

예제 #3

파일 보기

def classify_translate_simple(pTrains,pTests):
    dict=CEDict()
    syn=Synonym()
#    lm=LanguageModel()
    
    trains=[]
    tests=[]
    
    for label,p in pTrains:
        words=getTranlateFeatures(p,dict)
        trains.append(CDocument(label,words))
    for label,p in pTests:
        words=getTranlateFeatures(p,dict)
        tests.append(CDocument(label,words))
    
    return me_classify(trains,tests)

예제 #4

파일 보기

def blp_translate_pmi(pTrains,pTests):
    dict=CEDict()
    syn=Synonym()
    pmi=PMI()
    
    trains=[]
    tests=[]
    
    for label,p in pTrains:
        words= getTranlateFeaturesPMI(p,dict,pmi)
        trains.append(CDocument(label,words))
    for label,p in pTests:
        words= getTranlateFeaturesPMI(p,dict,pmi)
        tests.append(CDocument(label,words))
    
    blp=BLP(trains+tests)
    blp.LP_Classify(trains,tests)

예제 #5

파일 보기

def blp_translate_lm(pTrains,pTests):
    dict=CEDict()
    syn=Synonym()
    lm=LanguageModel()
    
    trains=[]
    tests=[]
    
    for label,p in pTrains:
        words=getTranslateFeaturesByLM(p,dict,lm)
        trains.append(CDocument(label,words))
    for label,p in pTests:
        words=getTranslateFeaturesByLM(p,dict,lm)
        tests.append(CDocument(label,words))
    
    blp=BLP(trains+tests)
    blp.LP_Classify(trains,tests)

예제 #6

파일 보기

def blp_sense_sentiment(pTrains,pTests):
    dict=CEDict()
    pmi=PMI()
    
    cn_lexicon=CnSentimentLexicon()
    en_lexicon=EnSentimentLexicon()
    
    trains=[]
    tests=[]
    
    for label,p in pTrains:
        words=getFeaturesSenseAndSentiment(p,dict,pmi,cn_lexicon,en_lexicon)
        trains.append(CDocument(label,words))
    for label,p in pTests:
        words=getFeaturesSenseAndSentiment(p,dict,pmi,cn_lexicon,en_lexicon)
        tests.append(CDocument(label,words))
    
    blp=BLP(trains+tests)
    blp.LP_Classify(trains,tests)

예제 #7

파일 보기

def blp_translate_cerelation(pTrains,pTests):
    dict=CEDict()
    pmi=PMI()
    
    trains=[]
    tests=[]
    
    for label,p in pTrains:
        words=getTranlateFeaturesCERelation(p,dict,pmi)
        trains.append(CDocument(label,words))
    for label,p in pTests:
        words=getTranlateFeaturesCERelation(p,dict,pmi)
        tests.append(CDocument(label,words))
    
#    for d in trains+tests:
#        d.words['SMOOTH']=1
    
    
    blp=BLP(trains+tests)
    blp.LP_Classify(trains,tests)

예제 #8

파일 보기

파일: document.py 프로젝트: tanhaishan/NLPCC_EmotionDetection

#! /usr/bin/env python
#coding=utf-8
import numpy as ny
from cedict import CEDict
import os

dict=CEDict() # init Chinese-English Dict

class CDocument:
    def __init__(self,label,words):
        self.label=label
        self.words=words

class Post:
    def __init__(self,content,happiness,sadness,anger,fear,surprise):
        self.content=content
        self.happiness=happiness.lower()
        self.sadness=sadness.lower()
        self.anger=anger.lower()
        self.fear=fear.lower()
        self.surprise=surprise.lower()
        
        self.words={}
        self.en={}
        self.cn={}
        for w in content.split():
            w=w.lower()
            self.words[w]=1
            if isASCII(w): 
                if isRealEnglishWord(w):
                    self.en[w]=1

예제 #9

파일 보기

파일: document.py 프로젝트: RieGan/Seminar_DDoSForecast

from cedict import CEDict
from datesolve import *
from event import *

ceDict = CEDict()
MONTHS = {'jan', 'feb', 'mar', 'apr', 'may', 'jun', 'jul', 'aug', 'sep', 'oct', 'nov', 'dec'}


class CDocument:
    def __init__(self, words, polarity, id, text, eventName):
        self.words = words
        self.polarity = polarity
        if polarity == True:
            self.label = 1
        else:
            self.label = 0

        self.id = id
        self.text = text
        self.eventName = eventName
    def __repr__(self):
        return "Data id:% s text:% s event:% s label:% s" %(self.id, self.words, self.eventName, self.label)


def readTweets(path):
    tweets = []
    monthDict = getMonthDict()
    for line in open(path, 'r').readlines():
        line = line.strip()
        if len(line) > 0:
            line = line.lower()