Esempi in Python per pages_details

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: spiders

Metodo/funzione: pages_details

Esempi su hotexamples.com: 2

pages_details in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per spiders.pages_details, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Esempio n. 1

Mostra file

File: 5700-57zz.py Progetto: javmoo70/javmoo1.0

from spiders import pages_details
#生成抓取的urls列表
movie_id1 = ["5"]
movie_id2 = ["7"]
movie_id3 = [
    "0", "1", "2", "3", "4", "5", "6", "7", "8", "9", "a", "b", "c", "d", "e",
    "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t",
    "u", "v", "w", "x", "y", "z"
]
movie_id4 = [
    "0", "1", "2", "3", "4", "5", "6", "7", "8", "9", "a", "b", "c", "d", "e",
    "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t",
    "u", "v", "w", "x", "y", "z"
]
movie_ids = []
for a in movie_id1:
    url_id = a
    for b in movie_id2:
        url_id1 = url_id + b
        for c in movie_id3:
            url_id2 = url_id1 + c
            for d in movie_id4:
                url_id3 = url_id2 + d
                movie_ids.append(url_id3)
movie_ids.reverse()
#开始抓取
for i in movie_ids:
    url = 'https://www.avmoo.com/cn/movie/' + i
    pages_details(url, i)
    print("完成" + i + "页面的抓取")
print("完成 5700-57zz 的页面抓取")

Esempio n. 2

Mostra file

File: 5800-58zz.py Progetto: javmoo70/javmoo1.0

#5800-58zz
from spiders import pages_details
#生成抓取的urls列表
movie_id1 = ["5"]
movie_id2 = ["8"]
movie_id3 = ["0","1","2","3","4","5","6","7","8","9","a","b","c","d","e","f","g","h","i","j","k","l","m","n","o","p","q","r","s","t","u","v","w","x","y","z"]
movie_id4 = ["0","1","2","3","4","5","6","7","8","9","a","b","c","d","e","f","g","h","i","j","k","l","m","n","o","p","q","r","s","t","u","v","w","x","y","z"]
movie_ids = []
for a in movie_id1:
    url_id = a
    for b in movie_id2:
        url_id1 = url_id+b
        for c in movie_id3:
            url_id2 = url_id1+c
            for d in movie_id4:
                url_id3 = url_id2+d
                movie_ids.append(url_id3)

movie_ids.reverse()
#开始抓取
for i in movie_ids:
    url = 'https://www.avmoo.com/cn/movie/' + i
    pages_details(url,i)
    print("完成" + i +"页面的抓取")
print("完成 5800-58zz 的页面抓取")