def __init__(self): # 商品页面抓取设置 self.crawler = XCCrawler() self.crawling_time = Common.now() # 当前爬取时间 self.crawling_begintime = '' # 本次抓取开始时间 self.crawling_beginDate = '' # 本次爬取日期 self.crawling_beginHour = '' # 本次爬取小时 # 门票所属商品信息 self.item_id = '' # 商品Id self.item_name = '' # 商品Name self.item_type = '' # 商品类型 # 门票类型 self.ticket_type = '' # 门票类型 # 门票信息 self.ticket_id = '' # 门票id self.ticket_name = '' # 门票名称 self.ticket_price = '' # 门票价 self.ticket_adprice = '' # 门票活动价 self.ticket_unit_name = '' # 门票(套票 单票 套餐等信息) self.ticket_tag = '' # 门票特点 # 数据信息 self.ticket_pages = {}
def __init__(self): # 抓取设置 self.crawler = XCCrawler() self.retrycrawler = RetryCrawler() self.crawling_time = Common.now() # 当前爬取时间 self.crawling_time_s = Common.time_s(self.crawling_time) self.crawling_begintime = '' # 本次抓取开始时间 self.crawling_beginDate = '' # 本次爬取日期 self.crawling_beginHour = '' # 本次爬取小时 # 频道信息 self.platform = '携程-pc' # 品牌团所在平台 self.channel_id = '' # 频道id self.channel_url = '' # 频道链接 self.channel_name = '' # 频道name self.channel_type = '' # 频道类型 # 频道所属地理位置信息 self.province_id = 0 # 省,州id self.province_name = '' # 省,州名称 # 原数据信息 self.channel_page = '' # 频道页面html内容 self.channel_pages = {} # 频道页面内请求数据列表 # channel items self.channel_items = [] # channel list self.channel_list = []
def __init__(self): # 抓取设置 self.crawler = XCCrawler() # dial client self.dial_client = DialClient() # local ip self._ip = Common.local_ip() # router tag self._tag = 'ikuai' # wait time self.w_time = 1
def __init__(self): # xc spot type self.worker_type = Config.XC_Spot # DB self.xc_type = Config.XC_TYPE # queue type self.mysqlAccess = MysqlAccess() # mysql access self.redisQueue = RedisQueue() # redis queue self.mongofsAccess = MongofsAccess() # mongodb fs access # 抓取设置 self.crawler = XCCrawler() # message self.message = Message() # 抓取时间设定 self.crawling_time = Common.now() # 当前爬取时间 self.begin_time = Common.now() self.begin_date = Common.today_s() self.begin_hour = Common.nowhour_s()
def __init__(self): # 商品页面抓取设置 self.crawler = XCCrawler() self.crawling_time = Common.now() # 当前爬取时间 self.crawling_begintime = '' # 本次抓取开始时间 self.crawling_beginDate = '' # 本次爬取日期 self.crawling_beginHour = '' # 本次爬取小时 # 单品类型商品所属频道 self.channel_id = '' self.channel_name = '' self.channel_url = '' self.channel_type = '' self.item_position = 0 # 商品信息 self.item_id = '' # 商品Id self.item_url = '' # 商品链接 self.item_pic_url = '' # 商品展示图片链接 self.item_name = '' # 商品Name self.item_desc = '' # 商品说明 self.item_book_status = 1 # 商品是否售卖 0:不售,1:在售 self.item_level = '' # 级别 self.item_area = '' # 地址 self.item_service = '' # 服务 self.item_comment = '' # 评论数 self.item_comment_grade = '' # 评分 # 商品交易 self.item_oriprice = '' # 商品原价 self.item_disprice = '' # 商品折扣价 self.item_discount = '' # 商品打折 # 门票 self.item_tickets = [] # 原数据信息 self.item_pageData = '' # 商品所属数据项内容 self.item_page = '' # 商品页面html内容 self.item_pages = {} # 商品页面内请求数据列表