Python HTML.cssselect 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: lxml.etree

클래스/타입: HTML

메소드/함수: cssselect

hotexamples.com에서의 예제들: 3

Python HTML.cssselect - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 lxml.etree.HTML.cssselect에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

xpath(30)

HTML(30)

find(4)

cssselect(3)

get(2)

decode(1)

findall(1)

findtext(1)

iterfind(1)

split(1)

strip(1)

예제 #1

파일 보기

def get_script(url):
    html = requests.get(url).content
    tree = HTML(html)

    try:
        script_html = tree.cssselect(".scrolling-script-container")[0]
        script = "".join([text for text in script_html.itertext()])
        return script
    except Exception as e:
        return None

예제 #2

파일 보기

파일: 爬虫测试2.py 프로젝트: zengyufei/pycharm

#####################
#  获取SF首页的标题
#####################
from lxml.etree import HTML
import requests

url = 'https://segmentfault.com/'
css_selector = '.title>a'  # 这是利用浏览器自动获取的,我甚至都不用知道它是什么意思

text = requests.get(url).text
page = HTML(text)

titles = []
for title in page.cssselect(css_selector):
    titles.append(title.text)

print(titles)

# 这一段程序写下来,不用动脑筋(无脑写),不消耗心智

예제 #3

파일 보기

파일: mastodon.py 프로젝트: danielbrackett/fediplay

def extract_links(toot):
    '''Extract all external links from a toot.'''

    html = HTML(toot['content'])
    all_links = html.cssselect('a')
    return [link.attrib['href'] for link in all_links if not link_is_internal(link)]