Python FreqDist.count 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: nltk.probability

클래스/타입: FreqDist

메소드/함수: count

hotexamples.com에서의 예제들: 3

Python FreqDist.count - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 nltk.probability.FreqDist.count에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

values(30)

freq(30)

plot(30)

most_common(30)

keys(30)

items(30)

inc(30)

iteritems(30)

N(30)

update(27)

get(24)

B(19)

hapaxes(14)

max(11)

FreqDist(11)

tabulate(9)

samples(8)

pprint(7)

pop(4)

has_key(3)

count(3)

append(2)

sorted_samples(1)

read(1)

sorted(1)

remove(1)

copy(1)

r_Nr(1)

next(1)

__iter__(1)

iterkeys(1)

__setitem__(1)

insert(1)

_cumulative_frequencies(1)

__init__(1)

예제 #1

파일 보기

파일: aula2codigo1.py 프로젝트: LucasCosas/machine-learning

from nltk.token import *
from nltk.tokenizer import WhitespaceTokenizer
from nltk.probability import FreqDist
from nltk.draw.plot import Plot

freq_dist = FreqDist()
corpus = Token(TEXT=open('dados/may2001_pdf.torto').read())
print corpus
WhitespaceTokenizer().tokenize(corpus)
print corpus

for token in corpus['SUBTOKENS']:
	freq_dist.inc(token['TEXT'])

# Quantas vezes a palavra form aparece no corpus?
freq_dist.count('form')
# Qual é a freqüência da palavra form?
freq_dist.freq('form')
# Quantas palavras foram contadas?
freq_dist.N()
# Quais foram os tipos de palavras encontradas?
freq_dist.samples()
# Qual é a palavra mais comum?
freq_dist.max()

예제 #2

파일 보기

파일: usingFrequencyDistribution.py 프로젝트: LucasCosas/machine-learning

from nltk.token import *
from nltk.tokenizer import WhitespaceTokenizer
from nltk.probability import FreqDist
from nltk.draw.plot import Plot

freq_dist = FreqDist()
corpus = Token(TEXT=open('dados/may2001_pdf.torto').read())
print corpus
WhitespaceTokenizer().tokenize(corpus)
print corpus

for token in corpus['SUBTOKENS']:
	freq_dist.inc(token['TEXT'])

# How many times did "the" occur?
freq_dist.count('the')

# What was the frequency of the word "the"?
freq_dist.freq('the')

# How many word tokens were counted?
freq_dist.N()

# What word types were encountered?
freq_dist.samples()

# What was the most common word?
freq_dist.max()

# What is the distribution of word lengths in a corpus?
freq_dist = FreqDist()

예제 #3

파일 보기

# Um exemplo da lei de Zipf

from nltk.token import *
from nltk.tokenizer import WhitespaceTokenizer
from nltk.probability import FreqDist
from nltk.draw.plot import Plot
freq_dist = FreqDist()

corpus = Token(TEXT=open('dados/may2001_pdf.torto').read())
WhitespaceTokenizer().tokenize(corpus)

for token in corpus['SUBTOKENS']:
    freq_dist.inc(token['TEXT'])

wordcount = freq_dist.samples()
#points = [(freq_dist.freq(l),l) for l in wordcount]
#points.sort()

x = 0
points = list(wordcount)
for l in wordcount:
    points[x] = (freq_dist.count(l), x)
    x = x + 1
points.sort()

print points
Plot(points)