Python expand_contractions 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: anticontract

메소드/함수: expand_contractions

hotexamples.com에서의 예제들: 2

Python expand_contractions - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 anticontract.expand_contractions에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: ldasetup.py 프로젝트: julien-bergner/yelp-challenge-api

 def tokenize(self):
     print "Tokenizing users.\n"
     for user, docs in self.users.iteritems():
         doc_lower = " ".join(docs).lower().replace("w/", "").replace("\n", "")
         doc_final = anticontract.expand_contractions(doc_lower)
         tokens = self.tokenizer.tokenize(doc_final)
         clean_tokens = [token for token in tokens if token not in self.stop_en]
         self.tokenized_docs[user] = clean_tokens
     print "Done tokenizing users.\n"

예제 #2

파일 보기

파일: LDAsetup.py 프로젝트: koschr/ldaforyelpchallenge

	def tokenize(self):	
		"""
		Tokenize (extract unique tokens) all reviews given in self.reviews
		"""			
		print 'Tokenizing reviews.\n'
		for doc in self.reviews:
			raw_doc = doc['text'].replace("w/", "")
			raw_doc = raw_doc.replace("\n", "")
			doc_lower = raw_doc.lower()
			doc_final = anticontract.expand_contractions(doc_lower)
			tokens = self.tokenizer.tokenize(doc_final)
			clean_tokens = [token for token in tokens if token not in self.stop_en]
			self.tokenized_docs[doc['review_id']] = {'tokens': clean_tokens, 'user': doc['user_id']}
		print 'Done tokenizing reviews.\n'