Exemple #1
0
def main(sncode):
    """ 图书比价工具整合 """

    book_list = []

    # 当当网图书数据
    dangdang(sncode, book_list)
    print('当当网数据爬取完成')

    # 京东网图书数据
    jd(sncode, book_list)
    print('京东网数据爬取完成')

    # 一号店网图书数据
    yhd(sncode, book_list)
    print('一号店网数据爬取完成')

    # 淘宝网图书数据
    taobao(sncode, book_list)
    print('淘宝网数据爬取完成')

    pass
    # 排序书的数据
    if book_list == []:
        print("没有找到{0}的查询结果".format(sncode))
        return
    else:
        book_list = sorted(book_list, key=lambda item : float(item["price"]), reverse=True)
        for book in book_list:
            print(book)
Exemple #2
0
def main(sn):
    """ 图书比价工具整合 """
    book_list = []
    # 当当网的数据
    print('当当网数据爬取完成')
    dangdang(sn, book_list)

    # 京东网数据
    print('京东网数据爬取完成')
    jd(sn, book_list)

    # 1号店数据
    print('1号店数据爬取完成')
    yhd(sn, book_list)

    # 淘宝数据
    print('淘宝网数据爬取完成')
    taobao(sn, book_list)

    # 打印所有数据列表
    for book in book_list:
        print(book)

    print('----------------开始排序-----------')

    # 排序书的数据
    book_list = sorted(book_list,
                       key=lambda item: float(item["price"]),
                       reverse=True)
    for book in book_list:
        print(book)
def spider_book(sn):
    """图书比价工具"""
    book_list = []

    # 当当网数据
    print('dangdang.com dada crawl complete')
    dangdang(sn, book_list)

    # 京东网数据
    print('jd.com dada crawl complete')
    jd(sn, book_list)

    # 一号店数据
    print('yhd.com dada crawl complete')
    yhd(sn, book_list)

    # 淘宝网数据
    # print('taobao.com dada crawl complete')

    #排序书的数据
    book_list = sorted(book_list,
                       key=lambda item: float(item["price"]),
                       reverse=True)

    print('----------------------排序结果------------------------')

    for book in book_list:
        print(book)
def main(sn):
    """ 图书比价工具整合 """
    book_list = []
    # 当当网的数据
    print('当当网数据爬取完成')
    dangdang(sn, book_list)

    # 京东网数据
    print('京东网数据爬取完成')
    jd(sn, book_list)

    # 1号店数据
    print('1号店数据爬取完成')
    yhd(sn, book_list)

    # 淘宝数据
    print('淘宝网数据爬取完成')
    taobao(sn, book_list)

    print('----------------开始排序-----------')

    now_book_list = []
    for item in book_list:
        if '免费' not in item['price']:
            now_book_list.append(item)

    # 排序书的数据
    book_list = sorted(now_book_list,
                       key=lambda item: float(item["price"]),
                       reverse=False)

    # 创建excel
    xls = openpyxl.Workbook()
    # 激活sheet
    sheet = xls.active
    # 要保存的列头
    title = ['书名', '链接', '价格', '书店']
    # 添加列头
    sheet.append(title)

    for item in book_list:
        sheet.append(
            [item['title'], item['link'], item['price'], item['store']])

    # 保存
    xls.save(sn + '.xlsx')

    print("----------------保存成功-----------")
Exemple #5
0
def main(sn):
    """ 图书比价工具 """
    book_list = []
    # 当当网图书
    print('当当网数据爬取完成')
    dangdang(sn, 1, book_list)

    # 京东网图书
    print('京东网数据爬取完成')
    # 淘宝网图书
    print('淘宝网数据爬取完成')
    # 排序书籍列表,价格排序格式是浮点
    book_list = sorted(book_list,
                       key=lambda item: float(item['price']),
                       reverse=False)
    for book in book_list:
        print(book)
Exemple #6
0
def main(sn):
    """ 图书比价工具 """
    book_list = []
    # 当当网的数据
    dangdang(sn, book_list)
    print('当当网的数据爬取完成')
    # 京东的数据
    print('京东的数据爬取完成')
    jd(sn, book_list)
    # 一号店的数据
    print('一号店的数据爬取完成')
    yhd(sn, book_list)
    # 打印所有数据列表
    #for book in book_list:
    #    print(book)
    print('************** 开始排序 ***************')
    # 排序书的数据
    book_list = sorted(book_list,
                       key=lambda item: float(item["price"]),
                       reverse=False)
    for book in book_list:
        print(book)