Exemplos de CacheDB em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: crawler.cachedb

Classe / Tipo: CacheDB

Exemplos em hotexamples.com: 2

CacheDB em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de crawler.cachedb.CacheDB em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

contains(1)

get(1)

put(1)

Métodos Frequentes

contains (1)

get (1)

put (1)

Relacionados

extrapolation_parallel

fits_data

ERPApp

Channel

shquote

LUIHorizontalStretchedLayout

get_error_details

Cross

libusb_set_pollfd_notifiers

all_are_positive_integers

Related in langs

ClassCounselingPeer (PHP)

MoneyValueConverterInterface (PHP)

LetPrimitive (C#)

RayGeometry (C#)

PPGeDrawTextWrapped (C++)

sAddress (C++)

NewAllocator (Go)

MakeVerticalTable (Go)

UnfailingIterator (Java)

Statistics (Java)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: scraper.py Projeto: otomarukanta/vkeiba

def __init__(self, parse, store): self._baseurl = 'http://keiba.yahoo.co.jp/' self._semaphore = asyncio.Semaphore(5) self._parse = parse self._store = store self._cache_db = CacheDB() self.logger = getLogger(__name__)

Exemplo n.º 2

0

Exibir arquivo

Arquivo: scraper.py Projeto: otomarukanta/vkeiba

class Scraper(metaclass=ABCMeta): def __init__(self, parse, store): self._baseurl = 'http://keiba.yahoo.co.jp/' self._semaphore = asyncio.Semaphore(5) self._parse = parse self._store = store self._cache_db = CacheDB() self.logger = getLogger(__name__) async def download(self, path): self.logger.info('Starting download %s', path) res = await aiohttp.request('GET', self._baseurl + path) self.logger.info('Finished download %s', path) return await res.text() async def _fetch_page(self, path): if self._cache_db.contains(path): self.logger.info('Starting get page from cache in %s', path) page = self._cache_db.get(path) self.logger.info('Finished get page from cache in %s', path) else: with (await self._semaphore): page = await self.download(path) self._cache_db.put(path, page) return page async def _scrape(self, path): page = await self._fetch_page(path) soup = bs4.BeautifulSoup(page, 'lxml') parsed = self._parse(soup) self._store(parsed) def crawl(self, paths): loop = asyncio.get_event_loop() task = [self._scrape(path) for path in paths] result = loop.run_until_complete(asyncio.gather(*task)) return [res for res in result if res]