Python save_comments示例

编程语言: Python

命名空间/包名称: db.weibo_comment

方法/功能: save_comments

hotexamples.com的示例: 3

Python save_comments - 已找到3个示例。这些是从开源项目中提取的最受好评的db.weibo_comment.save_comments现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

def crawl_comment_page(mid):
    limit = get_max_comment_page()
    cur_page = 1
    next_url = ''
    while cur_page <= limit:
        cur_time = int(time.time()*1000)
        if cur_page == 1:
            url = start_url.format(mid, cur_time)
        else:
            url = base_url.format(next_url, cur_time)
        html = get_page(url, user_verify=False)
        comment_datas = comment.get_comment_list(html, mid)

        if not comment_datas and cur_page == 1:
            crawler.warning('微博id为{}的微博评论未采集成功，请检查原因'.format(mid))
            return

        save_comments(comment_datas)
        # 由于这里每一步都要根据上一步来迭代，所以不适合采用网络调用（主要是比较麻烦）
        next_url = comment.get_next_url(html)

        if not next_url:
            crawler.info('微博{}的评论采集已经完成'.format(mid))
            return
        cur_page += 1

示例#2

显示文件

文件： comment.py 项目： zjlx/WeiboSpider

def crawl_comment_by_page(mid, page_num):
    cur_time = int(time.time() * 1000)
    cur_url = base_url.format(mid, page_num, cur_time)
    html = get_page(cur_url, user_verify=False)
    comment_datas = comment.get_comment_list(html, mid)
    save_comments(comment_datas)
    wb_data.set_weibo_comment_crawled(mid)
    return html

示例#3

显示文件

文件： comment.py 项目： dittoyi/weibospider

def crawl_comment_by_page(mid, page_num):
    cur_time = int(time.time() * 1000)
    cur_url = base_url.format(mid, page_num, cur_time)
    html = get_page(cur_url, user_verify=False)
    comment_datas = comment.get_comment_list(html, mid)
    save_comments(comment_datas)
    if page_num == 1:
        wb_data.set_weibo_comment_crawled(mid)
    return html