Python link_crawlerの例

プログラミング言語: Python

名前空間/パッケージ名: link_finder

メソッド/関数: link_crawler

hotexamples.comのコード掲載数: 2

Python link_crawler - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのlink_finder.link_crawlerの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: crawl_bot.py プロジェクト: crowdere/Darknet-Stack

 def collect_url(web_url):
     html_data_string = ''
     try:
         received_response = urlopen(web_url)
         if 'text/html' in received_response.getheader('Content-Type'):
             data_bytes = received_response.read()
             html_data_string = data_bytes.decode("latin-1")
         link_finder = link_crawler(Crawl_bot.start_link, web_url)
         link_finder.feed(html_data_string)
     except Exception as e:
         print(str(e))
         return set()
     return link_finder.page_urls()

コード例 #2

ファイルを表示

    def collect_url(web_url):
        html_data_string = ''
        try:
            received_response = urlopen(web_url)
            if 'text/html' in received_response.getheader('Content-Type'):
                data_bytes = received_response.read()
                html_data_string = data_bytes.decode("latin-1")
            link_finder = link_crawler(Crawl_bot.start_link, web_url)
            link_finder.feed(html_data_string)

            ##############################################################################################################################################################################################
            #######################################FOR SCRAPPING PURPOSES#################################################################################################################################
            f = open(
                Crawl_bot.folder_name + '/' +
                ((tldextract.extract(web_url)).domain), 'w')
            f.write(html_data_string)
            f.close()
###############################################################################################################################################################################################
###############################################################################################################################################################################################

        except Exception as e:
            print(str(e))
            return set()
        return link_finder.page_urls()