Python CqspiderItem Exemples

Langage de programmation: Python

Espace de nommage/Pack: cqspider.items

Class/Type: CqspiderItem

Exemples au hotexamples.com: 4

Python CqspiderItem - 4 exemples trouvés. Ce sont les exemples réels les mieux notés de cqspider.items.CqspiderItem extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

CqspiderItem(4)

Méthodes fréquemment utilisées

CqspiderItem (4)

Exemple #1

0

Afficher le fichier

Fichier : HcSpider.py Projet : jungledg/NUAA-bidinfo

def parse_page_content(self,response): item = CqspiderItem() page_content = response.xpath('//tr[4]/td[2]//div[1]').extract() page_content = page_content.pop() page_content = re.sub('<[^>]+>',' ',page_content) fil = FilterForHC(page_content) item['project_name'] = fil.get_project_name() item['bid_name'] = fil.get_bid_name() item['bid_time'] = fil.get_bid_time() item['bid_money'] = fil.get_bid_money() return item

Exemple #2

0

Afficher le fichier

Fichier : JjSpider.py Projet : jungledg/NUAA-bidinfo

def parse_page_content(self, response): item = CqspiderItem() content = response.xpath('//*[@id="textflag"]').extract().pop() content = re.sub('<[^>]*>', '', content) fil = FilterForJJ(content) item['project_name'] = fil.get_project_name() item['bid_name'] = fil.get_bid_name() item['bid_time'] = fil.get_bid_time() item['bid_money'] = fil.get_bid_money() return item

Exemple #3

0

Afficher le fichier

Fichier : CqSpider.py Projet : jungledg/NUAA-bidinfo

def parse_page_content(self, response): item = CqspiderItem() page_content = response.xpath( '//*[@id="bulletinContent"]/tbody').extract().pop() page_content = re.sub('<[^>]+>', ' ', page_content) fil = FilterForCQS(page_content) item['project_name'] = fil.get_project_name() item['bid_name'] = fil.get_bid_name() item['bid_time'] = fil.get_bid_time() item['bid_money'] = fil.get_bid_money() return item

Exemple #4

0

Afficher le fichier

Fichier : BbSpider.py Projet : jungledg/NUAA-bidinfo

def parse_page_content(self, response): item = CqspiderItem() page_content = response.xpath('//*[@id="tblInfo"]').extract() if page_content: page_content = page_content.pop() page_content = re.sub('<[^>]+>', ' ', page_content) fil = FilterForBB(page_content) item['project_name'] = fil.get_project_name() item['bid_name'] = fil.get_bid_name() item['bid_time'] = fil.get_bid_time() item['bid_money'] = fil.get_bid_money() return item