Python can_visit_link示例

编程语言: Python

命名空间/包名称: solution_one

方法/功能: can_visit_link

hotexamples.com的示例: 4

Python can_visit_link - 已找到4个示例。这些是从开源项目中提取的最受好评的solution_one.can_visit_link现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： test_solution_one.py 项目： rafael84/crawler-challenge

 def test_should_respect_the_robots_txt_rules(self):
     rules = '''
     User-Agent: *
     Disallow: /login
     '''
     solution_one.RERP.parse(rules)
     url = 'http://test.com/login'
     self.assertFalse(solution_one.can_visit_link(url))
     url = 'http://test.com/logout'
     self.assertTrue(solution_one.can_visit_link(url))

示例#2

显示文件

文件： test_solution_one.py 项目： rafael84/crawler-challenge

 def test_should_not_allow_external_links(self):
     url = 'http://test.com/internal'
     self.assertTrue(solution_one.can_visit_link(url))
     url = 'http://external.com/home'
     self.assertFalse(solution_one.can_visit_link(url))

示例#3

显示文件

文件： test_solution_one.py 项目： rafael84/crawler-challenge

 def test_should_not_allow_the_same_url_twice(self):
     url = 'http://test.com/twice'
     self.assertTrue(solution_one.can_visit_link(url))
     solution_one.discovered = [url, ]
     self.assertFalse(solution_one.can_visit_link(url))

示例#4

显示文件

文件： test_solution_one.py 项目： rafael84/crawler-challenge

 def test_should_check_the_black_list(self):
     solution_one.BLACKLIST_REGEX = re.compile(r'/private')
     url = 'http://test.com/private'
     self.assertFalse(solution_one.can_visit_link(url))
     url = 'http://test.com/public'
     self.assertTrue(solution_one.can_visit_link(url))