Python nth_level_domainの例

プログラミング言語: Python

名前空間/パッケージ名: lib

メソッド/関数: nth_level_domain

hotexamples.comのコード掲載数: 7

Python nth_level_domain - 7件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのlib.nth_level_domainの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: compute_hbias.py プロジェクト: dimitargnikolov/web-traffic-yahoo

def read_data(datadir, category_index, domain_level=None):
    index = {}

    all_clicks = 0
    clicks_without_user = 0
    for row in generate_pig_data(datadir):
        all_clicks += 1
        # (dt, sid, bcookie, referrer, target, refsite, refcat, targetsite, targetcat)
        # category_index will be either 5 or 6 for refsite or refcat
        category = row[category_index]
        user = row[1].strip()

        if user == '':
            clicks_without_user += 1
            continue

        if domain_level is not None:
            target = nth_level_domain(row[4], domain_level)
        else:
            target = row[4]

        if category not in index:
            index[category] = {}

        if user not in index[category]:
            index[category][user] = {}

        if target not in index[category][user]:
            index[category][user][target] = 0

        index[category][user][target] += 1

    logging.debug('All clicks: %d' % all_clicks)
    logging.debug('Clicks without users: %d' % clicks_without_user)
    return index

コード例 #2

ファイルを表示

def is_member(h, hosts):
	if len(hosts) == 1 and hosts[0] == '':
		return h == ''
	else:
		dls = domain_levels(hosts)
		for dl in dls:
			if nth_level_domain(h, dl) in hosts:
				return True
	return False

コード例 #3

ファイルを表示

def should_skip_host(h):
	if is_ip_address(h):
		return True
	elif domain_level(h) <= 1:
		return True
	for dl in DOMAIN_LEVELS:
	   	if nth_level_domain(h, dl) in UNWANTED_DOMAINS:
   			return True
	return fnmatches_multiple(UNWANTED_PATTERNS, h)

コード例 #4

ファイルを表示

def parents(url):
    """
	>>> parents('facebook.com')
	[]
	>>> parents('indiana.facebook.com')
	['facebook.com']
	>>> parents('1.2.3.news.bbc.co.uk')
	['2.3.news.bbc.co.uk', '3.news.bbc.co.uk', 'news.bbc.co.uk', 'bbc.co.uk']
	"""
    parent_urls = []
    dl = domain_level(url)
    if is_exception(url):
        end = 2
    else:
        end = 1
    for parent_dl in range(dl - 1, end, -1):
        parent_urls.append(nth_level_domain(url, parent_dl))
    return parent_urls

コード例 #5

ファイルを表示

ファイル: filter_targets.py プロジェクト: dimitargnikolov/web-traffic-iu

def should_skip_host(h):
    for dl in DOMAIN_LEVELS:
        if nth_level_domain(h, dl) in UNWANTED_DOMAINS:
            return True
    return False

コード例 #6

ファイルを表示

ファイル: filter_referrers.py プロジェクト: dimitargnikolov/web-traffic-iu

def should_skip_host(h):
	for dl in DOMAIN_LEVELS:
		if nth_level_domain(h, dl) in WANTED_DOMAINS:
			return False
	return True

コード例 #7

ファイルを表示

ファイル: remove_iu.py プロジェクト: dimitargnikolov/web-traffic-iu

def should_skip_host(h):
	for dl in DOMAIN_LEVELS:
	   	if nth_level_domain(h, dl) in IU_TRAFFIC:
   			return True
	return False