Python CacheDB Exemples

Langage de programmation: Python

Espace de nommage/Pack: crawler.cachedb

Class/Type: CacheDB

Exemples au hotexamples.com: 2

Python CacheDB - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de crawler.cachedb.CacheDB extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

contains(1)

get(1)

put(1)

Méthodes fréquemment utilisées

contains (1)

get (1)

put (1)

Associées

extrapolation_parallel

fits_data

ERPApp

Channel

shquote

LUIHorizontalStretchedLayout

get_error_details

Cross

libusb_set_pollfd_notifiers

all_are_positive_integers

Related in langs

ClassCounselingPeer (PHP)

MoneyValueConverterInterface (PHP)

LetPrimitive (C#)

RayGeometry (C#)

PPGeDrawTextWrapped (C++)

sAddress (C++)

NewAllocator (Go)

MakeVerticalTable (Go)

UnfailingIterator (Java)

Statistics (Java)

Exemple #1

0

Afficher le fichier

Fichier : scraper.py Projet : otomarukanta/vkeiba

def __init__(self, parse, store): self._baseurl = 'http://keiba.yahoo.co.jp/' self._semaphore = asyncio.Semaphore(5) self._parse = parse self._store = store self._cache_db = CacheDB() self.logger = getLogger(__name__)

Exemple #2

0

Afficher le fichier

Fichier : scraper.py Projet : otomarukanta/vkeiba

class Scraper(metaclass=ABCMeta): def __init__(self, parse, store): self._baseurl = 'http://keiba.yahoo.co.jp/' self._semaphore = asyncio.Semaphore(5) self._parse = parse self._store = store self._cache_db = CacheDB() self.logger = getLogger(__name__) async def download(self, path): self.logger.info('Starting download %s', path) res = await aiohttp.request('GET', self._baseurl + path) self.logger.info('Finished download %s', path) return await res.text() async def _fetch_page(self, path): if self._cache_db.contains(path): self.logger.info('Starting get page from cache in %s', path) page = self._cache_db.get(path) self.logger.info('Finished get page from cache in %s', path) else: with (await self._semaphore): page = await self.download(path) self._cache_db.put(path, page) return page async def _scrape(self, path): page = await self._fetch_page(path) soup = bs4.BeautifulSoup(page, 'lxml') parsed = self._parse(soup) self._store(parsed) def crawl(self, paths): loop = asyncio.get_event_loop() task = [self._scrape(path) for path in paths] result = loop.run_until_complete(asyncio.gather(*task)) return [res for res in result if res]