Python BaseCrawler 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: crawley.crawlers

클래스/타입: BaseCrawler

hotexamples.com에서의 예제들: 7

Python BaseCrawler - 7개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 crawley.crawlers.BaseCrawler에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

BaseCrawler(2)

_get_response(2)

_get_data(1)

예제 #1

파일 보기

파일: crawler_test.py 프로젝트: aparo/crawley

class CrawlerTest(unittest.TestCase):
    
    def setUp(self):
        self.crawler = BaseCrawler() 
    
    def _test_requests(self):
        """
            Very basic and foolish test
        """
        response = self.crawler._get_response("https://github.com/jmg")        
        self.assertTrue(response)
    
    def test_cookies(self):
        """
            This test asserts if the login was successful and the second request retrieves 
            a facebook's page that requires to be logged in.
        """        
        data = {'email' : 'user', 'pass': '******'}
        
        response = self.crawler._get_response("https://www.facebook.com/login.php?login_attempt=1", data)
        response = self.crawler._get_response("http://www.facebook.com/profile.php?id=1271577281")
        with open("url.html", 'w') as f:
            f.write(response.raw_html)
    
    def _test_post(self):
        
        crawler = PostCrawler()        
        crawler.start()

예제 #2

파일 보기

파일: crawler_test.py 프로젝트: wgfi110/crawley

class CrawlerTest(unittest.TestCase):

    def setUp(self):
        self.crawler = BaseCrawler()

    def _test_requests(self):
        """
            Very basic and foolish test
        """
        response = self.crawler._get_response("https://github.com/jmg")
        self.assertTrue(response)

    def test_cookies(self):
        """
            This test asserts if the login was successful and the second request retrieves
            a facebook's page that requires to be logged in.
        """
        data = {'email' : 'user', 'pass': '******'}

        response = self.crawler._get_response("https://www.facebook.com/login.php?login_attempt=1", data)
        response = self.crawler._get_response("http://www.facebook.com/profile.php?id=1271577281")
        with open("url.html", 'w') as f:
            f.write(response.raw_html)

    def _test_post(self):

        crawler = PostCrawler()
        crawler.start()

예제 #3

파일 보기

파일: shell.py 프로젝트: thebennos/crawley

    def execute(self):

        try:
            import IPython
        except ImportError:
            exit_with_error("Please install the ipython console")

        url = self.args[0]
        crawler = BaseCrawler()

        response = crawler._get_data(url)
        html = XPathExtractor().get_object(response)

        shell = IPython.Shell.IPShellEmbed(argv=[], user_ns={ 'response' : response })
        shell()

예제 #4

파일 보기

파일: shell.py 프로젝트: wgfi110/crawley

    def execute(self):

        try:
            import IPython
        except ImportError:
            exit_with_error("Please install the ipython console")

        url = self.args[0]
        crawler = BaseCrawler()

        response = crawler._get_response(url)
        html = XPathExtractor().get_object(response)

        shell = IPython.Shell.IPShellEmbed(argv=[],
                                           user_ns={'response': response})
        shell()

예제 #5

파일 보기

파일: simple_parser_test.py 프로젝트: aparo/crawley

    def test_generated_scrapers(self):

        test_dsl = """PAGE => http://www.python.org/
                      table3.model1 -> /html/body/div[5]/div/div/h1
                      table3.model2 -> /html/body/div
                      table4.model1 -> /html/body/div/span"""
        
        generator = Generator(test_dsl, settings)
        generator.gen_entities()
        
        scrapers_classes = generator.gen_scrapers()

        crawler = BaseCrawler()
        response = crawler._get_response("http://www.python.org/")

        for scraper_class in scrapers_classes:           
            scraper_class().scrape(response)

예제 #6

파일 보기

파일: crawler_test.py 프로젝트: aparo/crawley

 def setUp(self):
     self.crawler = BaseCrawler()

예제 #7

파일 보기

파일: crawler_test.py 프로젝트: wgfi110/crawley

 def setUp(self):
     self.crawler = BaseCrawler()