Python RobotFileParser.request_rate 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: urllib.robotparser

클래스/타입: RobotFileParser

메소드/함수: request_rate

hotexamples.com에서의 예제들: 3

Python RobotFileParser.request_rate - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 urllib.robotparser.RobotFileParser.request_rate에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

RobotFileParser(30)

can_fetch(30)

parse(30)

read(30)

set_url(30)

crawl_delay(7)

site_maps(5)

allow_all(4)

request_rate(3)

__init__(1)

disallow_all(1)

mtime(1)

예제 #1

파일 보기

    def _get_request_delay(
        host: str,
        url: str,
        robots_parser: RobotFileParser,
        delay_mapping: Dict[str, Union[int, float]],
        default_delay: Union[int, float],
    ) -> Union[int, float]:
        pass

        crawl_delay = robots_parser.crawl_delay('*')
        if crawl_delay is not None:
            delay_mapping[host] = crawl_delay
            logger.debug(
                'returning crawl delay value "%s" from robots.txt for url %s',
                crawl_delay, url)
            return crawl_delay

        request_rate = robots_parser.request_rate('*')
        if request_rate is not None:
            request_delay = request_rate.seconds / request_rate.requests
            delay_mapping[host] = request_delay
            logger.debug(
                'computing value "%s" from request delay info (%s/%s) from robots.txt for url %s',
                request_delay,
                request_rate.requests,
                request_rate.seconds,
                url,
            )
            return request_delay

        delay_mapping[host] = default_delay
        logger.debug('returning default delay value "%s" for url %s',
                     default_delay, url)
        return default_delay

예제 #2

파일 보기

    def robot_rules(self, user_agent: str):
        robot_parser = RobotFileParser(url=self.url_robots)
        robot_parser.read()

        return {
            'can_fetch': robot_parser.can_fetch(user_agent, self.url),
            'crawl_delay': robot_parser.crawl_delay(user_agent),
            'request_rate': robot_parser.request_rate(user_agent),
        }

예제 #3

파일 보기

파일: arana.py 프로젝트: eksop/arana

def parse_robotstxt(url):
    """
    Parse robots.txt
    """

    parsed = urlsplit(url)

    if parsed.scheme not in ['http', 'https']:
        return False

    if parsed.netloc == '':
        return False

    robot = RobotFileParser()
    robot.set_url(parsed.scheme + "://" + parsed.netloc + "/robots.txt")
    robot.read()

    return dict(
        allowed=robot.can_fetch('*', url),
        rate=robot.request_rate('*'),
        delay=robot.crawl_delay('*'),
    )