Ejemplos de Recommender.calc_distances en Python

Lenguaje de programación: Python

Namespace/Package Name: recommender

Clase / Tipo: Recommender

Método / Función: calc_distances

Ejemplos en hotexamples.com: 2

Python Recommender.calc_distances - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de recommender.Recommender.calc_distances extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Recommender(30)

get_recommendation(11)

fit(8)

recommender(5)

get_recommendations(4)

calc_distances(2)

artists(2)

calc_neighbors(2)

find_top_blocks(2)

choose_illusts_from_tag(2)

genres(2)

load_recommendations(2)

doRecommend(2)

generate(2)

recommend_for(2)

form_characteristics(2)

generate_user(1)

getTags(1)

get_aoi(1)

get_img(1)

get_interaction(1)

get_keywords(1)

save_user_visited_content(1)

get_languages(1)

get_most_popular(1)

get_ranking_list_by_both(1)

get_result(1)

get_topic_names(1)

get_url_page_contents(1)

get_user_visited_content(1)

items_repository(1)

matchTopic(1)

process_input(1)

recommend_projects(1)

Client(1)

evaluate(1)

fetchSafariRecommendation(1)

best_one_subcategory(1)

__init__(1)

accounts_recommender(1)

addToHistory(1)

addUserToGraph(1)

add_content_vector(1)

add_user_ratings(1)

allow_explicit_lyrics(1)

append_new_user(1)

as_view(1)

best_nine(1)

best_nine_subcategories(1)

build_annoy_indexer(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: __init__.py Proyecto: koschr/ldaforyelpchallenge

def run(source, target, num_topics = 100, passes = 20, lang = 'en', distance_measure = euclidean, percentage = 0.05):
	"""
	Main entry point for this package. Contains and executes the whole data pipeline. 

	Arguments:
	source -- The path string to the source file containing all reviews
	target -- The path string to the target directory where the neighbors for all users will be saved

	Keyword arguments:
	num_topics -- The number of topics LDA is supposed to discover (default 100)
	passes -- The number of iterations for the statistical inference algorithm (default 20)
	lang -- The language the reviews shall be sorted by (default 'en')
	distance_measure -- A python function that measures the distance between two vectors in a num_topics-dimensional vector space. 
				Must take two numpy arrays and return a float. (default euclidean)
	percentage -- The cutoff for being a close neighbor, i.e. two users are close if their distance is 
			within the closest percentage percent of all distances (default 0.05) 
	"""
	with open(source) as f:
		all_reviews = []
		for line in f:
			all_reviews.append(json.loads(line))

	reviews = filter_by_language(all_reviews, lang)

	rt = ReviewTokenizer(reviews)
	rt.tokenize()

	db = DictionaryBuilder(rt.tokenized_docs)
	db.build()

	dtmb = DTMBuilder(db.dictionary, db.srcTexts)
	dtmb.build()

	ldaw = LDAWrapper(dtmb.dtm, db.dictionary)
	ldaw.run(num_topics = num_topics, passes = passes)

	modelwrapper = LDAModelWrapper(ldaw.ldamodel, db.dictionary, sortByUsers(rt.tokenized_docs))
	posteriors = modelwrapper.get_all_posteriors()

	means = {}
	for key, value in posteriors.iteritems():
		means[key] = mean(value).tolist()

	x = Recommender(means)
	y = x.calc_distances(distance_measure)

	threshhold = fivePercent(y, percentage)

	for user in means.iterkeys():
		z = x.calc_neighbors(user, distance_measure, threshhold = threshhold)
		if len(target) > 0:
			fileName = target + '/' + user + '.json'
		else:
			fileName = user + '.json'
		with open(fileName, 'w') as g:
			json.dump(z, g)

Ejemplo n.º 2

Mostrar archivo

Archivo: build_statistic.py Proyecto: julien-bergner/yelp-challenge-api

def euclidean(x,y):   
    return np.sqrt(np.sum((x-y)**2))

means = {}
for key, value in posteriors.iteritems():
	means[key] = mean(value).tolist()

"""
with open('means_eachLine.json', 'w') as f:
	for key, value in means.iteritems():
		json.dump({key: value}, f)
		f.write('\n')
	#json.dump(means,f)

#neighbors = {}
x = Recommender(means)
for user in means.iterkeys():	
	y = x.calc_neighbors(user, euclidean)
	with open('neighbors/neighbors_' + user + '.json', 'w') as f:
		json.dump(y, f)
	#neighbors[user] = y


with open('neighbors_full.json', 'w') as f:
	json.dump(neighbors, f)
"""

x = Recommender(means)
y = x.calc_distances(euclidean)
with open('all_distances.json', 'w') as f:
	json.dump(y, f)