Python Normalizator.normalize 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: normalizator

클래스/타입: Normalizator

메소드/함수: normalize

hotexamples.com에서의 예제들: 3

Python Normalizator.normalize - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 normalizator.Normalizator.normalize에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

normalize(3)

Normalizator(2)

compute_distribuante(1)

normalize_dependant(1)

normalize_gpa(1)

normalize_salary(1)

usedPattern(1)

예제 #1

파일 보기

파일: test.py 프로젝트: topicus/SocialSuaci

def testTweets():
    for i in range(1, 8):
        statuses = api.GetSearch(term=settings_local.USERTRACK, lang="es", page=i, per_page=100)
        for s in statuses:
            t = Normalizator.normalize(s.text)
            if not (t.isspace()):
                if classifier.classify(extract_features(t.split())) == "reclamo":
                    print "\033[91m" + t
                else:
                    print "\033[94m" + t

예제 #2

파일 보기

파일: learn.py 프로젝트: topicus/SocialSuaci

def saveTweetsOf(screen_name, category):
  for i in range(1,4):
    statuses = api.GetSearch(term=settings_local.USERTRACK, lang='es', page=i,per_page=100)
    for s in statuses:
      if(s.text.find('RT',0,2)==-1):
        screen_name = s._user._screen_name
        t = Normalizator.normalize(s.text)
        em = Normalizator.usedPattern(Patterns.DUPLICATED_LETTERS)
        print Normalizator.usedPattern(Patterns.SPECIALCHARS_AND_MENTIONS)
        print smart_str(s.text.lower())
        if (not(t.isspace())):
          selected = raw_input('Es un reclamo?')
          tweets = db[settings_local.CATEGORIES[int(selected)]]          
          tweet = {'normalized_tweet': t,
                   'tweet': s.text,
                   'screen_name': screen_name,
                   'emphatized': em
                   }
          tweets.insert(tweet)

예제 #3

파일 보기

파일: test.py 프로젝트: topicus/SocialSuaci

        for s in statuses:
            t = Normalizator.normalize(s.text)
            if not (t.isspace()):
                if classifier.classify(extract_features(t.split())) == "reclamo":
                    print "\033[91m" + t
                else:
                    print "\033[94m" + t


allTweets = []
for c in settings_local.CATEGORIES:
    statuses = db[c].find()

    for s in statuses:
        t = s["normalized_tweet"]
        t = Normalizator.normalize(t)
        if not (t.isspace()):
            allTweets.append((t, c))

tweets = []
for (words, sentiment) in allTweets:
    words_filtered = [e.lower() for e in words.split() if len(e) >= 3]
    tweets.append((words_filtered, sentiment))


def get_words_in_tweets(tweets):
    all_words = []
    for (words, sentiment) in tweets:
        all_words.extend(words)
    return all_words