Python JobLoader.load_item 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: scraper.loaders

클래스/타입: JobLoader

메소드/함수: load_item

hotexamples.com에서의 예제들: 4

Python JobLoader.load_item - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 scraper.loaders.JobLoader.load_item에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

load_item(4)

add_value(4)

add_item(2)

자주 사용되는 메소드들

load_item (4)

add_value (4)

add_item (2)

예제 #1

파일 보기

파일: borzadela.py 프로젝트: 7loops/zaposlim.se

 def parse_job_detail(self, response):
     hxs = HtmlXPathSelector(response)
     
     title = hxs.select("//div[@id='businessmyaccountjobadpreviewmain']/div/font/text()").extract_unquoted()
     company = hxs.select("//li[@class='propertiesleft' and contains(text(),'Podjetje:')]/following-sibling::li/text()").extract_unquoted()
     
     if title and company:
         city = hxs.select("//li[@class='propertiesleft' and contains(text(),'Regija in kraj dela:')]/following-sibling::li/text()").extract_unquoted()
         category = hxs.select(u"//li[@class='propertiesleft2' and contains(text(),'Področje dela:')]/following-sibling::li/text()".encode('utf-8')).extract_unquoted()
         images_url = hxs.select("//img[@id='mainimage']/@src").extract()
         item=JobItem()
         
         if images_url:
             item.load_image(self.get_base_url(response, images_url[0]))
     
         loader = JobLoader(item)
         loader.add_value('title', title)
         loader.add_value('company', company)
         loader.add_value('category', category)
         loader.add_value('city', city)
         loader.add_value('details_url', url_query_cleaner(response.url))
         loader.add_value('published_date', hxs.select("//li[@class='dates']/text()").re(r".*:\s+(.*)"))
         loader.add_value('id', self.generate_id(response.url))
         loader.add_value('content', response.body_as_unicode())
         loader.add_value('source', self.name)
         loader.add_value('source_label', self.label)
         
         yield loader.load_item()

예제 #2

파일 보기

파일: delo.py 프로젝트: 7loops/zaposlim.se

 def parse_job_detail(self, response):        
     hxs = HtmlXPathSelector(response)
     
     title = hxs.select("//span[@class='header']/text()").extract_unquoted()       
     company = hxs.select("//span[@class='fontblacklarge']/b/text()").extract_unquoted()   
          
     if title and company: 
         city = hxs.select("//span[@class='fontblacklarge']/b[2]/text()").extract_unquoted()
         category = response.request.meta['category']        
         published_date = hxs.select("//span[@class='fontblacklarge']/../../following-sibling::tr[2]/td/b/text()").extract_unquoted()
         
         item=JobItem()
         images_url = hxs.select("//span[@class='fontblacklarge']/../following-sibling::td[2]/img/@src").extract()        
         
         if images_url:
             item.load_image(self.get_base_url(response, images_url[0]))
         
         loader = JobLoader(item)
         loader.add_value('title', title)
         loader.add_value('company', company)
         loader.add_value('category', category)
         loader.add_value('city', city)
         loader.add_value('details_url', url_query_cleaner(response.url, ('najdi', 'id')))
         loader.add_value('published_date', published_date)
         loader.add_value('id', self.generate_id(response.url, ('najdi', 'id')))
         loader.add_value('content', response.body_as_unicode())
         loader.add_value('source', self.name)
         loader.add_value('source_label', self.label)
         
         yield loader.load_item()

예제 #3

파일 보기

파일: mojedelo.py 프로젝트: 7loops/zaposlim.se

    def parse_job_detail(self, response):       
        loader = JobLoader(JobItem())
        loader.add_item(response.request.meta['item'])
        loader.add_value('id', self.generate_id(response.url))
        loader.add_value('source', self.name)
        loader.add_value('source_label', self.label)
        loader.add_value('content', response.body_as_unicode())

        yield loader.load_item()

예제 #4

파일 보기

파일: zavod.py 프로젝트: mkramb/zaposlim.se

    def parse_job_detail(self, response):
        hxs = HtmlXPathSelector(response)

        loader = JobLoader(JobItem())
        loader.add_item(response.request.meta['item'])
        loader.add_value('id', self.generate_id(response.url, ('IDEPD')))
        loader.add_value('source', self.name)
        loader.add_value('source_label', self.label)
        loader.add_value('summary', hxs.select("//div[@class='cc-gv']//tr/td[contains(text(),'Opis del in nalog')]/following-sibling::td[1]/text()").extract_unquoted())
        loader.add_value('content', response.body_as_unicode())

        yield loader.load_item()