Python Article.contentHead примеры использования

Язык программирования: Python

Пространство имен/Пакет: Article

Класс/Тип: Article

Метод/Функция: contentHead

Примеров на hotexamples.com: 2

Python Article.contentHead - 2 примера найдено. Это лучшие примеры Python кода для Article.Article.contentHead, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Article(30)

article(3)

date(3)

chapter_num(3)

build(3)

edit_date(3)

article_num(3)

article_ID(3)

article_link(3)

identification(3)

flaw_num(3)

link(3)

contentHead(2)

find_content_distances(1)

find_default_fonts(1)

content(1)

getArticlesByYear(1)

ename(1)

references(1)

download(1)

tnum(1)

create_pdf(1)

create_file(1)

convert_references_2(1)

citesCount(1)

concatenate_segments(1)

add_title(1)

_add_style(1)

addAttribute(1)

addDictionary(1)

addParagraph(1)

add_author(1)

add_content(1)

appendChild(1)

closeConnection(1)

assign_labels(1)

author(1)

citedBy(1)

citedByCount(1)

cites(1)

__of__(1)

cleanText(1)

to_string(1)

Пример #1

Показать файл

Файл: mysql.py Проект: crazyxiaoke/articleCrawler

 def queryList(self):
     sql = u'select id,title,content,contentHead from web_information'
     self.cur.execute(sql)
     res = self.cur.fetchall()
     articles = []
     for item in res:
         article = Article()
         article.id = item[0]
         article.title = item[1]
         article.content = item[2]
         article.contentHead = item[3]
         articles.append(article)
     return articles

Пример #2

Показать файл

Файл: zyue_crawler.py Проект: crazyxiaoke/articleCrawler

def parseListHtml(page, titleindex):
    next_page = {'page': page, 'title': titleindex}
    common.save_now_page(next_page)
    mysql = Mysql()
    s = ''
    if page > 1:
        s = '_' + repr(page)
    print(url.format(titles[titleindex], s))
    try:
        response = requests.get(url.format(titles[titleindex], s),
                                headers=headers,
                                timeout=10)
        response.encoding = 'gb2312'
        if response.status_code == 200:
            soup = BeautifulSoup(response.text, 'html.parser')
            re_coms = soup.find_all('ul', attrs={'class': 'recom_list'})
            articles = []
            for re_com in re_coms:
                article = Article(re_com.a.string, re_com.find('span', attrs={'class': 'gd1'}).a.attrs['href'])
                article.author = 'OK学车'
                article.contentHead = parseContentHead(re_com.find('li', attrs={'class': 'recom_nr'}).text)
                article.type = types[titles[titleindex]]
                articles.append(article)
            parseArticle(articles)
            # 保存到数据库
            mysql.insert_array(articles)
            mysql.close()
            # common.save_file(titles[titleIndex], '第{0}页'.format(page), repr(common.convert_to_dicts(articles)))
            sleep_time = random.randint(5, 10)
            print('休息', sleep_time, 's后再获取')
            time.sleep(sleep_time)
            parseListHtml(page + 1, titleindex)
        else:
            mysql.close()
            if titleindex + 1 < len(titles):
                parseListHtml(1, titleindex + 1)
    except Exception as e:
        print(traceback.format_exc())
        print('网页获取失败：', e)
        mysql.close()
        sleep_time = random.randint(1, 5)
        print(repr(sleep_time), 's后重新获取')
        time.sleep(sleep_time)
        parseListHtml(page + 1, titleindex)