Python PageInfoの例

プログラミング言語: Python

名前空間/パッケージ名: models

クラス/型: PageInfo

hotexamples.comのコード掲載数: 11

Python PageInfo - 11件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのmodels.PageInfoの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

from_query(4)

PageInfo(1)

コード例 #1

ファイルを表示

ファイル: links.py プロジェクト: markrwilliams/wapiti

 def extract_results(self, query_resp):
     ret = []
     for pid, pid_dict in query_resp.get('pages', {}).iteritems():
         page_info = PageInfo.from_query(pid_dict,
                                         source=self.source)
         ret.append(page_info)
     return ret

コード例 #2

ファイルを表示

ファイル: query_operations.py プロジェクト: 1ss/wapiti

 def extract_results(self, query_resp):
     ret = []
     for k, pid_dict in query_resp['pages'].iteritems():
         page = PageInfo.from_query(pid_dict,
                                    source=self.source)
         ret.append(page)
     return ret

コード例 #3

ファイルを表示

 def extract_results(self, query_resp):
     ret = []
     for k, pid_dict in query_resp['pages'].iteritems():
         page_info = PageInfo.from_query(pid_dict,
                                         source=self.source)
         ret.append(page_info)
     return ret

コード例 #4

ファイルを表示

 def extract_results(self, query_resp):
     ret = []
     for pid, pid_dict in query_resp['pages'].iteritems():
         if pid.startswith('-'):
             continue
         page_ident = PageInfo.from_query(pid_dict, source=self.source)
         ret.append(page_ident)
     return ret

コード例 #5

ファイルを表示

ファイル: files.py プロジェクト: slaporte/wapiti

 def extract_results(self, query_resp):
     ret = []
     for pid, pid_dict in query_resp["pages"].iteritems():
         if pid.startswith("-"):
             pid_dict["pageid"] = None  # TODO: breaks consistency :/
         page_ident = PageInfo.from_query(pid_dict, source=self.source)
         ret.append(page_ident)
     return ret

コード例 #6

ファイルを表示

ファイル: files.py プロジェクト: sahwar/wapiti

 def extract_results(self, query_resp):
     ret = []
     for pid, pid_dict in query_resp['pages'].iteritems():
         if pid.startswith('-'):
             pid_dict['pageid'] = None  # TODO: breaks consistency :/
         page_ident = PageInfo.from_query(pid_dict,
                                          source=self.source)
         ret.append(page_ident)
     return ret

コード例 #7

ファイルを表示

ファイル: misc.py プロジェクト: 1ss/wapiti

 def extract_results(self, query_resp):
     ret = []
     for pid, pid_dict in query_resp['pages'].iteritems():
         if pid.startswith('-'):
             continue
         page_ident = PageInfo.from_query(pid_dict,
                                          source=self.source)
         ret.append(page_ident)
     return ret

コード例 #8

ファイルを表示

ファイル: category.py プロジェクト: markrwilliams/wapiti

 def extract_results(self, query_resp):
     ret = []
     for k, pid_dict in query_resp['pages'].iteritems():
         try:
             page_ident = PageInfo.from_query(pid_dict,
                                              source=self.source)
         except ValueError:
             continue
         ret.append(page_ident)
     return ret

コード例 #9

ファイルを表示

ファイル: files.py プロジェクト: markrwilliams/wapiti

 def extract_results(self, query_resp):
     ret = []
     for pid, pid_dict in query_resp['pages'].iteritems():
         if pid.startswith('-'):
             pid_dict['pageid'] = None  # TODO: breaks consistency :/
         try:
             page_ident = PageInfo.from_query(pid_dict,
                                              source=self.source)
         except ValueError:
             continue
         ret.append(page_ident)
     return ret

コード例 #10

ファイルを表示

    def process_item(self, item, spider):
        try:

            existence = self.session.query(exists().where(
                PageInfo.currenturl == item['currenturl'])).scalar()
            if not existence:
                # 不存在
                self.session.add(
                    PageInfo(baseurl=item['baseurl'],
                             currenturl=item['currenturl'],
                             content=item['content'],
                             fetchtime=item['fetchtime'],
                             contentmd5=item['contentmd5'],
                             contenttype=item['contenttype'],
                             prevfetchtime=item['prevfetchtime'],
                             domain_name=item['domain_name'],
                             page_title=item['page_title'],
                             page_body=item['page_body']))
            else:
                if not self.session.query(exists().where(
                        PageInfo.contentmd5 == item['contentmd5'])).scalar():
                    # 数据存在，更新操作
                    self.session.query(PageInfo).filter(
                        PageInfo.currenturl == item['currenturl']).update({
                            'content':
                            item['content'],
                            'contentmd5':
                            item['contentmd5'],
                            'contenttype':
                            item['contenttype'],
                            'page_title':
                            item['page_title'],
                            'fetchtime':
                            item['fetchtime'],
                            'page_body':
                            item['page_body']
                        })
            self.session.commit()
        except Exception as e:
            print(e)
            self.session.rollback()
        return item

コード例 #11

ファイルを表示

ファイル: templates.py プロジェクト: sahwar/wapiti

 def extract_results(self, query_resp):
     ret = []
     for k, pid_dict in query_resp.get('pages', {}).items():
         page_ident = PageInfo.from_query(pid_dict, source=self.source)
         ret.append(page_ident)
     return ret