Python Document.parseの例

プログラミング言語: Python

名前空間/パッケージ名: readability.readability

クラス/型: Document

メソッド/関数: parse

hotexamples.comのコード掲載数: 2

Python Document.parse - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのreadability.readability.Document.parseの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

Document(30)

short_title(30)

summary(30)

title(20)

encode(9)

replace(9)

reverse_tags(4)

content(3)

transform(2)

get_clean_html(2)

get_publish_date(2)

parse(2)

split(2)

text_content(1)

summary_with_metadata(1)

strip(1)

read(1)

seek(1)

lower(1)

get_text(1)

get_author(1)

find_all(1)

find(1)

encoding(1)

write(1)

コード例 #1

ファイルを表示

def get_summary(url):
    html = urllib.request.urlopen(url).read()
    doc = Document(html)
    doc.parse(["summary", "short_title"])
    readable_article = doc.summary()
    readable_title = doc.short_title()
    return readable_article, readable_title

コード例 #2

ファイルを表示

ファイル: scraper.py プロジェクト: za419/reddit-news

def scrape(URL):
    """
    Return the text of the article found at URL
    Some whitespace changes will usually occur.
    """

    html = urllib.request.urlopen(URL).read()
    doc = Document(html)
    doc.parse(["summary", "short_title"])
    readable_article = doc.summary()
    soup = BeautifulSoup(readable_article, 'html.parser')
    text = soup.get_text()
    return text