コード例 #1
0
def process_hespress(link, title):
    link = link
    url, image, article = hespress(link)
    path = nlp(url)
    id_cat, pn, cs = all_predict(path)
    for i in range(0, len(id_cat)):
        if (id_cat[i] == 2 or id_cat[i] == 3 or id_cat[i] == 4):
            id_cat.append(1)
        if (id_cat[i] == 6 or id_cat[i] == 7 or id_cat[i] == 8):
            id_cat.append(5)
        if (id_cat[i] == 9):
            id_cat.append(34)
        if (id_cat[i] == 20 or id_cat[i] == 21):
            id_cat.append(35)
        if (id_cat[i] == 25):
            id_cat.append(24)
        if (id_cat[i] == 26):
            id_cat.append(36)
        if (id_cat[i] == 29 or id_cat[i] == 30):
            id_cat.append(37)
    for i in range(0, len(id_cat)):
        if (id_cat.count(id_cat[i]) == 2):
            id_cat.remove(id_cat[i])
    source = "hespress"
    return link, path, title, image, id_cat, pn, cs, source, article
コード例 #2
0
def process_sport(link, title):
    link = link
    url, image, article = sport(link)
    path = nlp(url)
    id_cat, posneg, comsim = all_predict(path)
    for i in range(len(id_cat)):
        if (id_cat[i] == 2 or id_cat[i] == 3 or id_cat[i] == 4):
            id_cat.append(1)
        if (id_cat[i] == 6 or id_cat[i] == 7 or id_cat[i] == 8):
            id_cat.append(5)
        if (id_cat[i] == 9):
            id_cat.append(34)
        if (id_cat[i] == 20 or id_cat[i] == 21):
            id_cat.append(35)
        if (id_cat[i] == 25):
            id_cat.append(24)
        if (id_cat[i] == 26):
            id_cat.append(36)
        if (id_cat[i] == 29 or id_cat[i] == 30):
            id_cat.append(37)
    for i in range(0, len(id_cat)):
        if (id_cat.count(id_cat[i]) == 2):
            id_cat.remove(id_cat[i])
    source = "le360 sport"
    return link, path, title, image, id_cat, posneg, comsim, source, article
コード例 #3
0
def process_afrique(link, title):
    link = link
    url, image, article = afrique(link)
    path = nlp(url)
    id_cat, posneg, comsim = all_predict(path)
    for i in range(len(id_cat)):
        if (id_cat[i] == 2 or id_cat[i] == 3 or id_cat[i] == 4):
            id_cat.append(1)
        if (id_cat[i] == 6 or id_cat[i] == 7 or id_cat[i] == 8):
            id_cat.append(5)
        if (id_cat[i] == 10):
            id_cat.append(9)
        if (id_cat[i] == 22 or id_cat[i] == 23):
            id_cat.append(21)
        if (id_cat[i] == 12):
            id_cat.append(11)
        if (id_cat[i] == 20):
            id_cat.append(19)
        if (id_cat[i] == 27):
            id_cat.append(26)
        if (id_cat[i] == 29):
            id_cat.append(28)
        if (id_cat[i] == 32 or id_cat[i] == 33):
            id_cat.append(37)
    for i in range(0, len(id_cat)):
        if (id_cat.count(id_cat[i]) == 2):
            id_cat.remove(id_cat[i])
    source = "le360 afrique"
    return link, path, title, image, id_cat, posneg, comsim, source, article