Python extract_text 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: usefulText

메소드/함수: extract_text

hotexamples.com에서의 예제들: 2

Python extract_text - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 usefulText.extract_text에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

url = 'http://www.cnn.com/2014/07/19/world/europe/ukraine-malaysia-airlines-crash/'

## fetch html
import requests
r=  requests.get(url)
html = r.content

##nltk: fetch text by cleaning html
import nltk
text = nltk.clean_html(html)

##fetch text based on density :useful text
import usefulText as u
text = u.extract_text(html)


## unicode 
text = text.decode('utf-8','ignore')

## segment into sentences
import sys
sys.path.append('../version0.0/')
import segment_sentence as ss


def isProper(sentence):
	if len(sentence) <=5:
		return False

	if '|' in sentence:
		return False

예제 #2

파일 보기

	def __init__(self, url):
		r= requests.get()
		html = r.content
		self.text = usefulText.extract_text(html).decode('utf-8', 'ignore')  ## Scope of improvement
		self.segmentor = ss.segmentor(1)