Python GsExtractor.setXsltFromFile 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: gooseeker

클래스/타입: GsExtractor

메소드/함수: setXsltFromFile

hotexamples.com에서의 예제들: 2

Python GsExtractor.setXsltFromFile - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 gooseeker.GsExtractor.setXsltFromFile에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

setXsltFromAPI(10)

GsExtractor(7)

extract(7)

setXsltFromFile(2)

extractHTML(1)

getXslt(1)

예제 #1

파일 보기

파일: jd_pc.py 프로젝트: mpp100579/test_case

 def getContent(self, url):
     browser = webdriver.PhantomJS(executable_path=self.phantomjsPath)
     browser.get(url)
     time.sleep(self.waittime)
     html = browser.execute_script(
         "return document.documentElement.outerHTML")
     doc = etree.HTML(html)
     jdlistExtra = GsExtractor()
     jdlistExtra.setXsltFromFile("jd_list.xml")
     output = jdlistExtra.extract(doc)
     return output

예제 #2

파일 보기

파일: 20692_crawl_gooseeker_bbs.py 프로젝트: tate11/intelligent-code-completion

#-*_coding:utf8-*-
# 使用gsExtractor类的示例程序
# 访问集搜客论坛，以xslt为模板提取论坛内容
# xslt保存在xslt_bbs.xml中
from urllib import request
from lxml import etree
from gooseeker import GsExtractor

# 访问并读取网页内容
url = "http://www.gooseeker.com/cn/forum/7"
conn = request.urlopen(url)
doc = etree.HTML(conn.read())

# 生成xsltExtractor对象
bbsExtra = GsExtractor()
# 调用set方法设置xslt内容
bbsExtra.setXsltFromFile("xslt_bbs.xml")
# 调用extract方法提取所需内容
result = bbsExtra.extract(doc)
# 显示提取结果
print(str(result))