Python HtmlPageRegionの例

プログラミング言語: Python

名前空間/パッケージ名: scrapely.htmlpage

クラス/型: HtmlPageRegion

hotexamples.comのコード掲載数: 6

Python HtmlPageRegion - 6件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのscrapely.htmlpage.HtmlPageRegionの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

HtmlPageRegion(4)

__new__(1)

よく使われるメソッド

HtmlPageRegion (4)

__new__ (1)

コード例 #1

ファイルを表示

ファイル: extractors.py プロジェクト: monocleman1/dd

 def _extractor(txt, htmlpage=None):
     if txt is None:
         return
     page = getattr(htmlpage, 'htmlpage', htmlpage)
     if not hasattr(txt, 'text_content'):
         txt = HtmlPageRegion(page, txt)
     data = extractor.extract(txt)
     if data:
         return extractor.adapt(data, page)

コード例 #2

ファイルを表示

ファイル: regionextract.py プロジェクト: bopopescu/vinalo

 def _extract_attribute(self, extraction_page, start_index, end_index, ignored_regions=None, **kwargs):
     data = []
     for (f, ta, ea) in self.tag_data:
         tag_value = extraction_page.htmlpage_tag(start_index).attributes.get(ta)
         if tag_value:
             region = HtmlPageRegion(extraction_page.htmlpage, tag_value)
             extracted = f(region)
             if extracted is not None:
                 data.append((ea, extracted))
     return data

コード例 #3

ファイルを表示

ファイル: pageobjects.py プロジェクト: zhimu66/scrapely

 def __new__(cls, htmlpage, regions):
     text = u''.join(regions)
     return HtmlPageRegion.__new__(cls, htmlpage, text)

コード例 #4

ファイルを表示

ファイル: regionextract.py プロジェクト: bopopescu/vinalo

 def extract(self, region):
     """Extract a region from the region passed"""
     text = self.extract_text(region)
     return HtmlPageRegion(region.htmlpage, text) if text else None

コード例 #5

ファイルを表示

ファイル: processors.py プロジェクト: monocleman1/dd

 def _exec(x):
     ret = g(x)
     if ret is not None:
         ret = HtmlPageRegion(ret.htmlpage, remove_tags(ret.text_content))
         return f(ret)
     return None

コード例 #6

ファイルを表示

ファイル: pageobjects.py プロジェクト: dreamfrog/jophiel

 def __new__(cls, htmlpage, regions):
     text = u''.join(regions)
     return HtmlPageRegion.__new__(cls, htmlpage, text)