Python KMeans.get_centroids Exemples

Langage de programmation: Python

Espace de nommage/Pack: k_means

Class/Type: KMeans

Méthode/Fonction: get_centroids

Exemples au hotexamples.com: 2

Python KMeans.get_centroids - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de k_means.KMeans.get_centroids extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

KMeans(30)

fit(9)

cluster(7)

train(7)

run(6)

calculate_performance(4)

get_centroids(2)

print_results(2)

main_loop(2)

predict(2)

open_dataset(1)

k_means(1)

kmeans(1)

train_model(1)

print_distance(1)

plot_objective_function(1)

step(1)

initCentroids(1)

report(1)

run_k_means(1)

start(1)

init_centers(1)

get_clusters(1)

get_sse_score(1)

classify_centroids(1)

_get_initial_centroids(1)

_is_finish(1)

_squared_euclidian_dist(1)

_update_centroids_and_data(1)

calc_err(1)

calculate_sse(1)

centroids_find_closest(1)

cluster_points(1)

get_msc_avg(1)

compute_sse(1)

evaluate(1)

findClosestCentroids(1)

find_centers(1)

fit_predict(1)

get_cluster(1)

_choose_cluster(1)

update_k(1)

Méthodes fréquemment utilisées

KMeans (30)

fit (9)

cluster (7)

train (7)

run (6)

calculate_performance (4)

get_centroids (2)

print_results (2)

main_loop (2)

predict (2)

Méthodes fréquemment utilisées

open_dataset (1)

k_means (1)

kmeans (1)

train_model (1)

print_distance (1)

plot_objective_function (1)

step (1)

initCentroids (1)

report (1)

run_k_means (1)

start (1)

init_centers (1)

get_clusters (1)

get_sse_score (1)

classify_centroids (1)

_get_initial_centroids (1)

_is_finish (1)

_squared_euclidian_dist (1)

_update_centroids_and_data (1)

calc_err (1)

Méthodes fréquemment utilisées

start (1)

init_centers (1)

get_clusters (1)

get_sse_score (1)

classify_centroids (1)

_get_initial_centroids (1)

_is_finish (1)

_squared_euclidian_dist (1)

_update_centroids_and_data (1)

calc_err (1)

calculate_sse (1)

centroids_find_closest (1)

cluster_points (1)

get_msc_avg (1)

compute_sse (1)

evaluate (1)

findClosestCentroids (1)

find_centers (1)

fit_predict (1)

get_cluster (1)

_choose_cluster (1)

update_k (1)

Méthodes fréquemment utilisées

calculate_sse (1)

centroids_find_closest (1)

cluster_points (1)

get_msc_avg (1)

compute_sse (1)

evaluate (1)

findClosestCentroids (1)

find_centers (1)

fit_predict (1)

get_cluster (1)

_choose_cluster (1)

update_k (1)

Exemple #1

0

Afficher le fichier

Fichier : radial_basis_network.py Projet : sungwons/Machine_Learning

def train(self, training_data, do_clustering=False, num_of_means=-1): if do_clustering: # Run k-means on the training set, the centroids become the middle of the hidden nodes kmeans_model = KMeans(num_of_means) kmeans_model.cluster(training_data) centroids = kmeans_model.get_centroids() # Determine the spread for each hidden node, spread for cent_1_idx, cent_1_val in enumerate(centroids): total_distance = 0.0 for cent_2_idx, cent_2_val in enumerate(centroids): if cent_1_idx != cent_2_idx: # Calculate distance between two centroids total_distance += sqrt( sum((np.array(cent_1_val[:-1]) - np.array(cent_2_val[:-1]))**2)) # Spread defined above, centroid = hidden node center self.hidden_nodes.append( (cent_1_val, 2 * (total_distance / (training_data.shape[0] - 1)))) else: # Randomized 10% subset of training data will serve as hidden node centers random_centers_for_hidden_nodes = [] indices = [] while len(indices) < (training_data.shape[0] * 0.1): random_idx = np.random.randint(0, training_data.shape[0]) if not random_idx in indices: indices.append(random_idx) random_centers_for_hidden_nodes = training_data[indices] # Determine the spread for each hidden node, spread for inst_1_idx, inst_1_val in enumerate( random_centers_for_hidden_nodes): total_distance = 0.0 for inst_2_idx, inst_2_val in enumerate( random_centers_for_hidden_nodes): if inst_1_idx != inst_2_idx: # Calculate distance between two instances total_distance += sqrt( sum((inst_1_val[:-1] - inst_2_val[:-1])**2)) # Spread defined above, instance = hidden node center self.hidden_nodes.append( (inst_1_val[:-1], 2 * (total_distance / (len(indices) - 1)))) print( "Chose random training instances to serve as hidden node centers" ) # Initial weights for gradient descent self.weights = \ np.array([np.random.randint(-100, 100) for weight in range(len(self.hidden_nodes))]) print("Initialized weight vector") # Learn weights to determine hidden node influence on output done = False while not done: print("Started gradient descent") # Batch updating of weights, store individual updates in new_weights new_weights = np.array([0.0 for i in range(len(self.weights))]) for instance in training_data: # Determine Gaussian outputs gaussian_outputs = [] for node in self.hidden_nodes: # radial basis function gaussian_outputs.append( exp((-1 / float(2 * (node[1]**2))) * (sqrt(sum((instance[:-1] - node[0])**2))))) # Determine error gradient (implies a vector) gradient = [] for gaussian_output in gaussian_outputs: if self.learner_type == "REGRESSION": gradient.append( 2 * (np.dot(self.weights, gaussian_outputs) - instance[-1]) * gaussian_output) else: activation_score = 1 / ( 1 + exp(np.dot(self.weights, gaussian_outputs))) gradient.append( (activation_score - instance[-1]) * (activation_score * (1 - activation_score)) * gaussian_output) # Calculate weight update new_weights += (self.weights - (self.learning_rate * np.array(gradient))) new_weights = (new_weights / training_data.shape[0]) if (abs(sum(self.weights - new_weights))) < 0.01: done = True if not done: print("Weights were updated by %f last iteration" % abs(sum(self.weights - new_weights))) self.weights = new_weights print("Found weights: %s" % str(self.weights))

Exemple #2

0

Afficher le fichier

# 10 fold cross validation fold_size = data_instances.shape[0] / 10 data_indices = [idx for idx in xrange(data_instances.shape[0])] for num_of_means in xrange(1, 50): total_performance = 0.0 for holdout_fold_idx in xrange(10): # try some num of means kmeans_model = KMeans(num_of_means) # run k means on training data to find centroids clusters = kmeans_model.cluster( \ data_instances[ \ np.array( \ np.setdiff1d(data_indices, data_indices[ \ fold_size * holdout_fold_idx : \ fold_size * holdout_fold_idx + fold_size]))]) centroids = kmeans_model.get_centroids() for cluster_idx in xrange(len(clusters)): ave_label = 0.0 for instance in clusters[cluster_idx]: ave_label += instance[-1] if len(clusters[cluster_idx]) > 0: ave_label = ave_label / len(clusters[cluster_idx]) if learner_type == "CLASSIFICATION": ave_label = int(round(ave_label)) centroids[cluster_idx].append(ave_label) # for classification, vote to determine centroid classification # for regression, average to find centroid estimate # feed centroids into k-NN as training data kNN_model = KNearestNeighbor(best_ks[test[0]], learner_type) kNN_model.train(centroids)