Python normalize_url 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: krauler.url

메소드/함수: normalize_url

hotexamples.com에서의 예제들: 3

Python normalize_url - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 krauler.url.normalize_url에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: page.py 프로젝트: pombredanne/krauler

    def parse(self):
        tags = [('a', 'href'), ('img', 'src'), ('link', 'href'),
                ('iframe', 'src')]

        # TODO: check rel="canonical"
        urls = set([])
        for tag_name, attr_name in tags:
            for tag in self.doc.findall('.//%s' % tag_name):
                attr = tag.get(attr_name)
                if attr is None:
                    continue
                url = normalize_url(urljoin(self.url, attr))
                if url is not None:
                    urls.add(url)

        on_parse.send(self, urls=urls)

        for url in urls:
            self.state.crawl(url, path=self.next_path)

예제 #2

파일 보기

파일: page.py 프로젝트: pombredanne/krauler

 def url(self):
     url = self.raw_url
     if self._has_response():
         url = self._response.url
         url = normalize_url(url)
     return url

예제 #3

파일 보기

파일: config.py 프로젝트: pombredanne/krauler

 def seeds(self):
     if not hasattr(self, '_seeds'):
         seeds = [normalize_url(s) for s in self.get_list('seed')]
         self._seeds = [s for s in seeds if s is not None]
     return self._seeds