예제 #1
0
def zajemi_dodatne_knjige():
    for knjiga in urlji_knjig_iz_serij:
        print(knjiga)
        orodja.shrani_stran(
            'https://www.goodreads.com' + knjiga[0],
            'dodatne_knjige/{}.html'.format(
                knjiga[1]))  # tko bova laži vedle kere so ble naknadno
예제 #2
0
def zajemi_zanre():
    slovar_vseh_url_zanrov = {
        **slovar_url_zanrov_od_avtorjev,
        **slovar_url_zanrov
    }
    print(slovar_vseh_url_zanrov)
    for zanr in slovar_vseh_url_zanrov.items():
        print(zanr)
        orodja.shrani_stran('https://www.goodreads.com' + zanr[1],
                            'zanri/{}.html'.format(zanr[0]))
예제 #3
0
def zajemi_knjige():
    """Iz spletnega seznama "What to read after Harry Potter" zajamemo url-je vseh knjig na sznamu.
    Seznam je trenutno dolg 15 strani."""

    for stran in range(16):
        r = requests.get(
            'https://www.goodreads.com/list/show/559.What_To_Read_After_Harry_Potter?page={}'
            .format(stran))
        page_source = r.text
        linki = [
        ]  # tu se nabirajo vsi linki do spletnih strani, ki jih moramo prebrati.
        for zadetek in re.finditer(vzorec_linka, page_source):
            # če je v naslovu dvopičje, vprašaj ali slash, pride do napake
            popravljen_naslov = re.sub(
                '[:|/?*]', '-',
                zadetek.groupdict()['naslov']) + zadetek.groupdict()['id']
            linki += [('https://www.goodreads.com' +
                       zadetek.groupdict()['link_knjige'], popravljen_naslov)]
        for link in linki:
            # Vse html datoteke shranimo v mapo knjige
            orodja.shrani_stran(link[0], 'knjige/{}.html'.format(link[1]))
예제 #4
0
def zajemi_serije():
    for serija in slovar_url_serij.items():
        print(serija)
        orodja.shrani_stran('https://www.goodreads.com' + serija[1],
                            'serije/{}.html'.format(serija[0]))
예제 #5
0
def zajemi_avtorje():
    for avtor in slovar_url_avtorjev.items():
        print(avtor)
        orodja.shrani_stran(avtor[1], 'avtorji/{}.html'.format(avtor[0]))