Python api_crawlの例

プログラミング言語: Python

名前空間/パッケージ名: logcrawler.rest

メソッド/関数: api_crawl

hotexamples.comのコード掲載数: 4

Python api_crawl - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのlogcrawler.rest.api_crawlの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: spider.py プロジェクト: shymonk/tools

    def handle_crawl_start(self, url, start_time):
        """ Call RESTFul API to record crawling start.
        """
        data = dict(url=url, size=0, status='downloading',
            desc=None, start=start_time, end=None)

        # call rest api to get crawling record
        # create a new one if no record found
        # else update crawling status for this record
        items = rest.api_crawl(api='get', target_url=url)
        if len(items) > 0:
            data['id'] = items[0].get('id')
            rest.api_crawl(api='update', target_url=url, post_data=data)
        else:
            rest.api_crawl(api='create', target_url=url, post_data=data)

コード例 #2

ファイルを表示

ファイル: spider.py プロジェクト: clicknull/tools-2

    def handle_crawl_start(self, url, start_time):
        """ Call RESTFul API to record crawling start.
        """
        data = dict(url=url,
                    size=0,
                    status='downloading',
                    desc=None,
                    start=start_time,
                    end=None)

        # call rest api to get crawling record
        # create a new one if no record found
        # else update crawling status for this record
        items = rest.api_crawl(api='get', target_url=url)
        if len(items) > 0:
            data['id'] = items[0].get('id')
            rest.api_crawl(api='update', target_url=url, post_data=data)
        else:
            rest.api_crawl(api='create', target_url=url, post_data=data)

コード例 #3

ファイルを表示

ファイル: spider.py プロジェクト: shymonk/tools

    def handle_crawl_end(self, url, start_time, end_time, result, size):
        """ Call RESTFul API to record crawling end status.
        """
        # sleep 0.5s to avoid updating status frequently
        time.sleep(0.5)

        if result == "success":
            status, desc = "done", None
        else:
            status, desc = "error", result

        data = dict(url=url, size=size, status=status,
            desc=desc, start=start_time, end=end_time)

        items = rest.api_crawl(api='get', target_url=url)
        if len(items) > 0:
            data['id'] = items[0].get('id')
            rest.api_crawl(api='update', target_url=url, post_data=data)
        else:
            rest.api_crawl(api='create', target_url=url, post_data=data)

コード例 #4

ファイルを表示

ファイル: spider.py プロジェクト: clicknull/tools-2

    def handle_crawl_end(self, url, start_time, end_time, result, size):
        """ Call RESTFul API to record crawling end status.
        """
        # sleep 0.5s to avoid updating status frequently
        time.sleep(0.5)

        if result == "success":
            status, desc = "done", None
        else:
            status, desc = "error", result

        data = dict(url=url,
                    size=size,
                    status=status,
                    desc=desc,
                    start=start_time,
                    end=end_time)

        items = rest.api_crawl(api='get', target_url=url)
        if len(items) > 0:
            data['id'] = items[0].get('id')
            rest.api_crawl(api='update', target_url=url, post_data=data)
        else:
            rest.api_crawl(api='create', target_url=url, post_data=data)