Python get_page_extractorの例

プログラミング言語: Python

名前空間/パッケージ名: lib.parsing

メソッド/関数: get_page_extractor

hotexamples.comのコード掲載数: 3

Python get_page_extractor - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのlib.parsing.get_page_extractorの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: edx_crawler.py プロジェクト: dfrEak/web-crawler

def extract_units(url, headers, file_formats):
	"""
	Parses a webpage and extracts its resources e.g. video_url, sub_url, etc.
	"""
	#logging.info("Processing '%s'", url)

	page = get_page_contents(url, headers)
	page_extractor = get_page_extractor(url)
	units = page_extractor.extract_units_from_html(page, BASE_URL, file_formats)
	return units

コード例 #2

ファイルを表示

def get_available_sections(url, headers):
    """
	Extracts the sections and subsections from a given url
	"""
    logging.debug("Extracting sections for :" + url)

    page = get_page_contents(url, headers)
    page_extractor = get_page_extractor(url)
    sections = page_extractor.extract_sections_from_html(page, BASE_URL)

    logging.debug("Extracted sections: " + str(sections))
    return sections

コード例 #3

ファイルを表示

def get_courses_info(url, headers):
    """
	Extracts the courses information from the dashboard.
	"""
    logging.info('Extracting course information from dashboard.')

    page = get_page_contents(url, headers)
    page_extractor = get_page_extractor(url)
    courses = page_extractor.extract_courses_from_html(page, BASE_URL)

    logging.debug('Data extracted: %s', courses)

    return courses