Python subtask示例

编程语言: Python

命名空间/包名称: crawler.tasks.inspect_url

方法/功能: subtask

hotexamples.com的示例: 4

Python subtask - 已找到4个示例。这些是从开源项目中提取的最受好评的crawler.tasks.inspect_url.subtask现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

def inspect_previously_bad_urls(previous_crawl_id):
    tasks = []
    try:
        previous_crawl = Crawl.objects.get(id=previous_crawl_id)
    except Crawl.DoesNotExist:
        previous_crawl = None
    if previous_crawl:
        # Get URLInspections from previous_crawl that has exists=False
        qs = previous_crawl.urlinspection_set.filter(exists=False)
        note_text = "Closer inspection of 'bad' urls from previous crawl with id {}".format(
            previous_crawl_id)
        crawl = Crawl.objects.create(notes=note_text,
                                     related_crawl_id=previous_crawl_id)
        for obj in qs:
            obj_info = {
                'app_label': 'cjdata',
                'model': 'dataset',
                'id': obj.id,
                'crawl_id': crawl.id
            }
            task = inspect_url.subtask((obj.url, ), {
                'method': 'GET',
                'related_object': obj_info,
                'stream': True
            },
                                       countdown=2)
            tasks.append(task)
        g = group(tasks)
        return g()
    else:
        return None

示例#2

显示文件

文件： tasks.py 项目： jalbertbowden/hall-of-justice

def inspect_all_dataset_urls():
    tasks = []
    qs = Dataset.objects.all()
    crawl = Crawl.objects.create()
    for obj in qs:
        obj_info = {"app_label": "cjdata", "model": "dataset", "id": obj.id, "crawl_id": crawl.id}
        task = inspect_url.subtask((obj.url,), {"related_object": obj_info}, countdown=2)
        tasks.append(task)
    g = group(tasks)
    return g()

示例#3

显示文件

def inspect_all_dataset_urls():
    tasks = []
    qs = Dataset.objects.all()
    crawl = Crawl.objects.create()
    for obj in qs:
        obj_info = {
            'app_label': 'cjdata',
            'model': 'dataset',
            'id': obj.id,
            'crawl_id': crawl.id
        }
        task = inspect_url.subtask((obj.url, ), {'related_object': obj_info},
                                   countdown=2)
        tasks.append(task)
    g = group(tasks)
    return g()

示例#4

显示文件

文件： tasks.py 项目： jalbertbowden/hall-of-justice

def inspect_previously_bad_urls(previous_crawl_id):
    tasks = []
    try:
        previous_crawl = Crawl.objects.get(id=previous_crawl_id)
    except Crawl.DoesNotExist:
        previous_crawl = None
    if previous_crawl:
        # Get URLInspections from previous_crawl that has exists=False
        qs = previous_crawl.urlinspection_set.filter(exists=False)
        note_text = "Closer inspection of 'bad' urls from previous crawl with id {}".format(previous_crawl_id)
        crawl = Crawl.objects.create(notes=note_text, related_crawl_id=previous_crawl_id)
        for obj in qs:
            obj_info = {"app_label": "cjdata", "model": "dataset", "id": obj.id, "crawl_id": crawl.id}
            task = inspect_url.subtask(
                (obj.url,), {"method": "GET", "related_object": obj_info, "stream": True}, countdown=2
            )
            tasks.append(task)
        g = group(tasks)
        return g()
    else:
        return None