Esempi in Python per ItemLoader.replace_css

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: scrapy.loader

Classe/tipologia: ItemLoader

Metodo/funzione: replace_css

Esempi su hotexamples.com: 1

ItemLoader.replace_css in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per scrapy.loader.ItemLoader.replace_css, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

ItemLoader(30)

add_xpath(30)

load_item(30)

get_xpath(30)

default_output_processor(30)

default_input_processor(30)

get_collected_values(30)

add_css(30)

add_value(30)

replace_value(28)

get_output_value(28)

nested_css(14)

nested_xpath(11)

_add_value(8)

get_css(6)

selector(6)

__init__(6)

get_value(4)

items(2)

values(2)

price_in(2)

number_of_reviews_in(1)

strip(1)

add_xpath_string(1)

address_out(1)

replace_css(1)

replace(1)

originCity_in(1)

features_in(1)

TakeFirst(1)

ad_value(1)

load_items(1)

default_onput_processor(1)

default_ouput_processor(1)

_local_item(1)

defualt_output_processor(1)

destinationCity_in(1)

deafult_input_processor(1)

Esempio n. 1

Mostra file

File: curriculum.py Progetto: alan8365/nutc_curriculum

    def parse(self, response):

        all_row = response.css(".empty_html tr")

        for i in range(1, len(all_row)):
            row = all_row[i]
            course_loader = ItemLoader(item=CourseItem(), selector=row)

            # https://aisap.nutc.edu.tw/public/day/course_list.aspx?sem=1081&clsno=1120170121&_p=2 -> 1120170121
            class_id = re.search(r'clsno=[\w\d]*', response.url)[0][6:]

            course_loader.replace_css('number', 'td:nth-child(2)::text')
            course_loader.replace_value('class_id', class_id)
            course_loader.replace_css('name', 'td:nth-child(4)::text, td:nth-child(4) > strong::text')
            course_loader.replace_css('time', 'td:nth-child(6)::text')
            course_loader.replace_css('location', 'td:nth-child(6)::text')
            course_loader.replace_css('compulsory', 'td:nth-child(7)::text')
            course_loader.replace_css('credit', 'td:nth-child(8)::text')
            course_loader.replace_css('popular', 'td:nth-child(9) > strong::text')
            course_loader.replace_css('teacher_name', 'td:nth-child(10)::text')
            course_loader.replace_css('popular_limit', 'td:nth-child(11)::text')

            yield course_loader.load_item()

        next_page = response.css('.page > b:last-child > a::attr(href)').get()

        if next_page:
            yield response.follow(next_page)