Python Downloader.download_file 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: downloader

클래스/타입: Downloader

메소드/함수: download_file

hotexamples.com에서의 예제들: 5

Python Downloader.download_file - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 downloader.Downloader.download_file에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

download(30)

Downloader(30)

download_course_by_url(6)

download_images(6)

close(5)

download_all(4)

download_file(4)

open(4)

download_other_files(4)

download_ram(4)

DownloadSlip(4)

add_job(3)

download_meeting(3)

join(3)

execute(2)

end(2)

downloadPage(2)

dl(2)

download_upd(2)

download_image(2)

add(2)

access_page_with_cache(2)

stop(2)

abort(2)

stats(2)

download_files(2)

download_gsm(2)

__init__(2)

download_meiju(1)

download_tags(1)

download_vid(1)

download_link(1)

download_to(1)

download_similar_artists(1)

download_stations(1)

download_song(1)

download_meiju_episode(1)

download_series(1)

download_list(1)

download_patents(1)

download_note_details(1)

download_next(1)

download_meiju_season(1)

download_video(1)

CDownload(1)

downloadall(1)

get_idx(1)

update_artist_popularity(1)

skip_download_of_song(1)

save_all_mutual_fund_info(1)

예제 #1

파일 보기

 def test_download_google_results_file(self):
     query = 'Well of Ascension'
     file_name = os.path.join('temp', 'google_results.html')
     if os.path.exists(file_name):
         os.remove(file_name)
     d = Downloader()
     url = d.goodreads_id_query(query)
     result = d.download_file(url, file_name)
     self.assertTrue(os.path.exists(file_name))

예제 #2

파일 보기

def kntu_download(user_name, password, pasted_urls):

    kntu_headers = {
        'User-Agent':
        'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.193 Safari/537.36',
    }

    kntu_login_data = {
        'anchor': '',
        'username': user_name,
        'password': password,
        'rememberusername': '******'
    }

    kntu_downloader = Downloader('https://vc.kntu.ac.ir/login/index.php',
                                 'https://connect.kntu.ac.ir/',
                                 kntu_login_data, kntu_headers, kntu_headers)
    if not kntu_downloader.login({'logintoken'}):
        return

    for url in pasted_urls:
        if re.match(
                r'https://vc\d*\.kntu\.ac\.ir/mod/adobeconnect/joinrecording\.php.*',
                url):
            filename = re.findall('recording=(\d+)&', url)[0]
            print('Downloading ' + filename + '...')
            kntu_downloader.set_name_to_save(filename)
            kntu_downloader.set_pasted_url(url)
            kntu_downloader.set_cookies()
            if not kntu_downloader.create_downlaod_link():
                continue
            kntu_downloader.download_file()
            kntu_downloader.save_file()
            kntu_downloader.extract_zip_file()
            kntu_downloader.convert_media()
            kntu_downloader.download_other_files()
            print(filename + ' downloaded!')
        else:
            print('Wrong URL format')

예제 #3

파일 보기

파일: subscene.py 프로젝트: mtahirtariq/easysub

 def download(self, sub, path):
     r = requests.get(sub.page_url)
     if r.status_code == 200:
         soup = self._get_soup(r.text)
         sub.url = self._get_full_url(
             soup.find(u'a', id=u'downloadButton')[u'href'])
         dl = Downloader()
         zip_path = os.path.splitext(path)[0] + u'.zip'
         if dl.download_file(sub.url, zip_path):
             is_extration_success = self._extract_sub_zip(zip_path, path)
             try:
                 os.remove(zip_path)
             except OSError, e:
                 pass
             if is_extration_success:
                 return True

예제 #4

파일 보기

파일: subscene.py 프로젝트: mtahirtariq/easysub

	def download(self, sub, path):
		r = requests.get(sub.page_url)
		if r.status_code == 200:
			soup = self._get_soup(r.text)
			sub.url = self._get_full_url(
				soup.find(u'a', id=u'downloadButton')[u'href']
			)
			dl = Downloader()
			zip_path = os.path.splitext(path)[0] + u'.zip'
			if dl.download_file(sub.url, zip_path):
				is_extration_success = self._extract_sub_zip(zip_path, path)
				try:
					os.remove(zip_path)
				except OSError, e:
					pass
				if is_extration_success:
					return True

예제 #5

파일 보기

class WearCollector(Collector):
    def __init__(self,
                 reporter: Reporter,
                 waiter: Waiter,
                 outdir: str,
                 useragent: str = ''):
        super(WearCollector, self).__init__()
        self.reporter: Reporter = reporter
        self.waiter = waiter
        self.outdir = outdir
        self.useragent = useragent
        self.cacher = Cacher(self.outdir)
        # 非同期処理の同時接続数制御
        self.semaphore = Semaphore(2)
        # ファイルダウンローダ
        self.downloader = Downloader(self.waiter, self.semaphore,
                                     self.reporter)

    async def download_user_page(self, url: str, page_num):
        url = url + f'?pageno={page_num}'

        # キャッシュがあれば使う
        filename = urllib.parse.quote(url, safe='') + '.html'
        content, info = self.cacher.get(filename)
        if content and info:
            html = content
            realurl = info.get('realurl')
            self.reporter.report(INFO, f'use cache {url}')
        else:
            await self.waiter.wait(url)
            async with self.semaphore:
                self.reporter.report(INFO, f'fetching {url}', type=NETWORK)
                async with aiohttp.request(
                        'get', url, headers={'user-agent':
                                             self.useragent}) as res:
                    html = await res.text()
                    realurl = str(res.url)
                    self.cacher.set(filename, html, {
                        'status': res.status,
                        'realurl': realurl
                    })

        # 終了条件
        if page_num >= 2 and realurl.count('?pageno') == 0:
            return False
        else:
            for url, data in await self.run_in_executor(parse_user, html):
                await self.add_future(
                    'gallery',
                    self.gallery_collector(url, 1, 501, userdata=data))
            return True

    async def user_collector(self, url: str, pagestart: int, pageend: int):
        await self.queued_paging(
            pagestart, pageend,
            lambda page: self.download_user_page(url, page))

    async def download_gallery_page(self,
                                    url: str,
                                    page_num: int,
                                    userdata=None):
        url = url + f'?pageno={page_num}'
        filename = urllib.parse.quote(url, safe='') + '.html'
        content, info = self.cacher.get(filename)
        if content and info:
            html = content
            realurl = info.get('realurl')
            self.reporter.report(INFO, f'use cache {url}')
        else:
            await self.waiter.wait(url)
            async with self.semaphore:
                self.reporter.report(INFO, f'fetching {url}', type=NETWORK)
                async with aiohttp.request(
                        'get', url, headers={'user-agent':
                                             self.useragent}) as res:
                    html = await res.text()
                    realurl = str(res.url)
                    self.cacher.set(filename, html, {
                        'status': res.status,
                        'realurl': realurl
                    })

        # 終了条件
        if page_num >= 2 and realurl.count('?pageno') == 0:
            return False
        else:
            for url, data in await self.run_in_executor(
                    parse_gallely, html, userdata):
                imagefile = urllib.parse.quote(url, safe='')
                tmp_save(os.path.join(self.outdir, imagefile + '.json'),
                         json.dumps(data))
                imagepath = os.path.join(self.outdir, imagefile)
                if not os.path.exists(imagepath):
                    await self.add_future(
                        'image',
                        self.downloader.download_file(
                            url,
                            imagepath,
                            headers={'user-agent': self.useragent}))
            return True

    async def gallery_collector(self,
                                url: str,
                                pagestart: int,
                                pageend: int,
                                userdata=None):
        await self.queued_paging(
            pagestart, pageend, lambda page: self.download_gallery_page(
                url, page, userdata=userdata))