Python link_crawler Examples

Programming Language: Python

Namespace/Package Name: link_finder

Method/Function: link_crawler

Examples at hotexamples.com: 2

Python link_crawler - 2 examples found. These are the top rated real world Python examples of link_finder.link_crawler extracted from open source projects. You can rate examples to help us improve the quality of examples.

Example #1

Show file

File: crawl_bot.py Project: crowdere/Darknet-Stack

 def collect_url(web_url):
     html_data_string = ''
     try:
         received_response = urlopen(web_url)
         if 'text/html' in received_response.getheader('Content-Type'):
             data_bytes = received_response.read()
             html_data_string = data_bytes.decode("latin-1")
         link_finder = link_crawler(Crawl_bot.start_link, web_url)
         link_finder.feed(html_data_string)
     except Exception as e:
         print(str(e))
         return set()
     return link_finder.page_urls()

Example #2

Show file

    def collect_url(web_url):
        html_data_string = ''
        try:
            received_response = urlopen(web_url)
            if 'text/html' in received_response.getheader('Content-Type'):
                data_bytes = received_response.read()
                html_data_string = data_bytes.decode("latin-1")
            link_finder = link_crawler(Crawl_bot.start_link, web_url)
            link_finder.feed(html_data_string)

            ##############################################################################################################################################################################################
            #######################################FOR SCRAPPING PURPOSES#################################################################################################################################
            f = open(
                Crawl_bot.folder_name + '/' +
                ((tldextract.extract(web_url)).domain), 'w')
            f.write(html_data_string)
            f.close()
###############################################################################################################################################################################################
###############################################################################################################################################################################################

        except Exception as e:
            print(str(e))
            return set()
        return link_finder.page_urls()