Python ngramCount 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: sms2

메소드/함수: ngramCount

hotexamples.com에서의 예제들: 2

Python ngramCount - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 sms2.ngramCount에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: token.py 프로젝트: fvdsn/NLP

def tokensFilter(tokenlines):
	
	lexicons = sms2.ngramCount(tokenlines, 1)
	filteredLines = []
	
	for line in tokenlines:
		tokenline = []
		for token in line:
			if lexicons[(token,)]<3:
				tokenline.append('<unk>')
			else : tokenline.append(token)
		filteredLines.append(tokenline)
	
	return filteredLines

예제 #2

파일 보기

파일: token.py 프로젝트: fvdsn/NLP

def main():
	
	trainfile = open("../smstrain.txt")
	lexicon = sms2.ngramCount(smartTokenizer(trainfile),4)
	
	lexicon_list = []
	for lex in lexicon.keys():
		lexicon_list.append( (lexicon[lex],lex) )

	lexicon_list.sort(reverse=True)
	print lexicon_list
	print len(lexicon_list)
	
	histo = sms2.histogram(lexicon)
	
	print histo
	
	writer = csv.writer(open("quadricounts.csv", "wb"))
	writer.writerows(lexicon_list)