Python soup_parse 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: gumbo

메소드/함수: soup_parse

hotexamples.com에서의 예제들: 9

Python soup_parse - 9개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 gumbo.soup_parse에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: GetElement.py 프로젝트: muminoff/GumboQuery

 def _isFile(self, filename):
     isFile = re.match('[\w]+.html', filename)
     if not isinstance(isFile, types.NoneType):
         content = open(filename)
         self.q = gumbo.soup_parse(content.read())
         return True
     else:
         return False

예제 #2

파일 보기

파일: GetElement.py 프로젝트: CarterTsai/GumboQuery

 def _isFile(self, filename):
     isFile = re.match('[\w]+.html', filename)
     if not isinstance(isFile, types.NoneType):
         content = open(filename)
         self.q = gumbo.soup_parse(content.read())
         return True
     else:
         return False

예제 #3

파일 보기

파일: GetElement.py 프로젝트: muminoff/GumboQuery

 def _isUrl(self, url):
     isUrl = re.match('^http', url)
     if not isinstance(isUrl, types.NoneType):
         response = urllib2.urlopen(url)
         self.q = gumbo.soup_parse(response.read())
         return True
     else:
         return False

예제 #4

파일 보기

파일: GetElement.py 프로젝트: CarterTsai/GumboQuery

 def _isUrl(self, url):
     isUrl = re.match('^http', url)
     if not isinstance(isUrl, types.NoneType):
         response = urllib2.urlopen(url)
         self.q = gumbo.soup_parse(response.read())
         return True
     else:
         return False

예제 #5

파일 보기

파일: mdevices.py 프로젝트: concord/demo

def raw_urls():
    def link_extractor(attr_array):
        for t in attr_array:
            if len(t) == 2:
                (href, link) = t
                if href == "href" and len(link) > 0:
                    return link
        return None

    urls = []
    try:
        req = requests.get("http://www.fda.gov/MedicalDevices/ProductsandMedicalProcedures/DeviceApprovalsandClearances/510kClearances/ucm089428.htm")
        soup = gumbo.soup_parse(req.text)
        links = soup.findAll('a', href=re.compile('.*\.zip'))
        attrs = map(lambda x: x.attrs, links)
        urls = map(link_extractor, attrs)
    except:
        urls = []
    return urls

예제 #6

파일 보기

def benchmark_gumbo_bs3():
    parser = gumbo.soup_parse(html_unicode)
    divs = parser.findAll("div")
    print "gumbo bs3", len(divs)

예제 #7

파일 보기

파일: GetElement.py 프로젝트: muminoff/GumboQuery

 def setHtml(self, html):
     self.q = gumbo.soup_parse(html)

예제 #8

파일 보기

파일: benchmark_parsers.py 프로젝트: mewbak/gumbocy

def benchmark_gumbo_bs3():
    parser = gumbo.soup_parse(html_unicode)
    divs = parser.findAll("div")
    print "gumbo bs3", len(divs)

예제 #9

파일 보기

파일: GetElement.py 프로젝트: CarterTsai/GumboQuery

 def setHtml(self, html):
     self.q = gumbo.soup_parse(html)