Python SiteArchiver.taskProcess示例

编程语言: Python

命名空间/包名称: WebMirror.Engine

类/类型: SiteArchiver

方法/功能: taskProcess

hotexamples.com的示例: 2

Python SiteArchiver.taskProcess - 已找到2个示例。这些是从开源项目中提取的最受好评的WebMirror.Engine.SiteArchiver.taskProcess现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

SiteArchiver(6)

synchronousJobRequest(5)

taskProcess(2)

upsertResponseLinks(1)

示例#1

显示文件

文件： Test.py 项目： GodOfConquest/ReadableWebProxy

def test(url, debug=True):

	parsed = urllib.parse.urlparse(url)
	root = urllib.parse.urlunparse((parsed[0], parsed[1], "", "", "", ""))

	new = db.WebPages(
		url       = url,
		starturl  = root,
		netloc    = parsed.netloc,
		distance  = 50000,
		is_text   = True,
		priority  = 500000,
		type      = 'unknown',
		fetchtime = datetime.datetime.now(),
		)

	if debug:
		print(new)
	archiver = SiteArchiver(None)
	ret = archiver.taskProcess(job_test=new)

	if debug:
		print(archiver)
		print(ret.keys())

		if "plainLinks" in ret and "rsrcLinks" in ret: # Looks like a HTML page. Print the relevant info
			print_html_response(archiver, new, ret)
		if "rss-content" in ret:
			print_rss_response(archiver, new, ret)


	pass

示例#2

显示文件

文件： Test.py 项目： MyAnimeDays/ReadableWebProxy

def test(url, debug=True, rss_debug=False):
	if rss_debug:
		print("Debugging RSS")
		flags.RSS_DEBUG = True

	parsed = urllib.parse.urlparse(url)
	root = urllib.parse.urlunparse((parsed[0], parsed[1], "", "", "", ""))

	new = db.WebPages(
		url       = url,
		starturl  = root,
		netloc    = parsed.netloc,
		distance  = 50000,
		is_text   = True,
		priority  = 500000,
		type      = 'unknown',
		fetchtime = datetime.datetime.now(),
		)

	if debug:
		print(new)
	archiver = SiteArchiver(None)
	archiver.taskProcess(job_test=new)