Ejemplos de Run.provide_result en Python

Lenguaje de programación: Python

Namespace/Package Name: models

Clase / Tipo: Run

Método / Función: provide_result

Ejemplos en hotexamples.com: 1

Python Run.provide_result - 1 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de models.Run.provide_result extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Run(17)

query(3)

id(2)

put(2)

person(2)

pickup(2)

fetcher(2)

deadline(2)

run_data(1)

statusobj(1)

statusid(1)

status(1)

sms_maama_contact_flows_antenatal(1)

sms_maama_contact_flows(1)

select(1)

save(1)

run_exists(1)

cafe(1)

group_exists(1)

cafeid(1)

provide_result(1)

add_runs(1)

data(1)

modified(1)

jsondatetime(1)

is_open(1)

insert_many(1)

time(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: crawlers.py Proyecto: hdknr/pecker

class Crawler(object):

    def __init__(self, site, name=None):

        self.site = site
        name = name or str( localtime( now() ) )
        self.run = Run( name=name, site = site )
        self.run.save()

        self.br = M.Browser()
        self.br.set_handle_robots(False)

    def crawl(self,result ,force=False):

        if result.link.available == False or result.status != None:
            if not force:
                return []

        #: get page
        res=self.br.open(result.link.url,timeout=2.0) 
        result.status = res.code  
        result.content_type = res.info()['Content-Type']

        if not result.content_type or result.content_type.find('text/') <0:
            #: PDF ... 
            result.save()
            return []

        result.set_output(res.get_data())

        result.save()

        #: page links
        next_links=result.children()

        #: page has cases
        for c in result.link.case_set.all():
            case_result, case_result_created= LinkResult.objects.get_or_create(
                                                run=self.run,
                                                link=result.link,
                                                case = c
                                            )
            #: TOOD: this implementation expect only 1 depth
            if case_result.status == None:
                if c.form_index >= 0 : 
                    self.br.select_form( nr = c.form_index )
                    for k,v in c.form_params.items(): 
                        self.br[ k ] = v
                    res = self.br.submit()
                    case_result.status = res.code
                    case_result.content_type=res.info()['Content-Type']
                    if result.content_type or result.content_type.find('text/') >=0:
                        case_result.set_output(res.get_data() )
                    case_result.save()

            self.br.open(result.link.url,timeout=2.0,)           #: access original page

        return next_links

    def start(self,url=None,parent=None,follow=True ,force=False):
        #: parent : parent Link instance
        self.br.clear_history()
        time.sleep(0.01 )        
        url = url or self.site.start_url

        result =None
        try:
            result = self.run.provide_result( url, parent )      
            if result == None:
                return 
            next_links = self.crawl( result,force=force)
        except:
            if result:
                result.errors = traceback.format_exc()
                result.save()
            return

        if not follow:
            return 

        for path in next_links:
            self.start(  path ,result.link)