コード例 #1
0
 def end(self, downer):
     for url, name in self.parse():
         url = abs_href(url, self.url)
         if url in downer.history: break
         downer.add(
             self.next_saver(url,
                             "%s/%s" % (self.path, name.replace('/', '_'))))
コード例 #2
0
ファイル: page_model.py プロジェクト: BGCX262/zspy-svn-to-git
 def end(self,downer):
     for url,name in self.parse():
         downer.add(
             self.next_saver(
                 abs_href(url,self.url),
                 "%s/%s"%(self.path,name.replace('/','_'))
             )
         )
コード例 #3
0
ファイル: fetch.py プロジェクト: BGCX262/zspy-svn-to-git
def img_saver(downer, url, html, url_prefix, base_dir=join("img")):
    html = BeautifulSoup(html)
    for i in html.findAll('img'):
        src = i.get('src', None)
        if src:
            url = abs_href(src, url)
            ref = url.split('://')[1]
            i['src'] = join(url_prefix, ref)
            downer.add(url, join(base_dir, ref))
    return str(html)
コード例 #4
0
ファイル: page_model.py プロジェクト: BGCX262/zspy-svn-to-git
 def end(self,downer):
     for url,name in self.parse():
         url=abs_href(url,self.url)
         if url in downer.history:break
         downer.add(
             self.next_saver(
                 url,
                 "%s/%s"%(self.path,name.replace('/','_'))
             )
         )
コード例 #5
0
ファイル: fetch.py プロジェクト: BGCX262/zspy-svn-to-git
def img_saver(downer,url,html,url_prefix,base_dir=join("img")):
    html=BeautifulSoup(html)
    for i in html.findAll('img'):
        src=i.get('src',None)
        if src:
            url=abs_href(src,url)
            ref=url.split('://')[1]
            i['src']=join(url_prefix,ref)
            downer.add(url,join(base_dir,ref))
    return str(html)
コード例 #6
0
 def end(self, downer):
     for url, name in self.parse():
         downer.add(
             self.next_saver(abs_href(url, self.url),
                             "%s/%s" % (self.path, name.replace('/', '_'))))