Python WikiTfIdfVectorizer.get_label_vector Beispiele

Programmiersprache: Python

Namespace / Paketname: WikiTfIdfVectorizer

Methode / Funktion: get_label_vector

Beispiele auf hotexamples.com: 1

Python WikiTfIdfVectorizer.get_label_vector - 1 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die WikiTfIdfVectorizer.WikiTfIdfVectorizer.get_label_vector, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

get_cluster_list(1)

get_label_vector(1)

get_vectorized_dataset(1)

get_vectorizer(1)

vectorize(1)

Beispiel #1

Datei anzeigen

Datei: doc_clustering.py Projekt: catherineverdiergo/MS_BIGDATA2016

stop_w = set(ENGLISH_STOP_WORDS)
# Enrich stop_words set with wiki frequent technical tags
stop_w = stop_w.union(['url', 'http', 'www', 'ref', 'jpg', 'file', 'com'])
stop_w = stop_w.union(['web', 'category', 'reference', 'title', 'org', 'br'])

w_tf_idf = WikiTfIdfVectorizer(stop_words=stop_w,
                               use_idf=opts.use_idf,
                               n_features=opts.n_features,
                               use_hashing=opts.use_hashing)
w_tf_idf.vectorize(wsl)

# get vectorized dataset
X = w_tf_idf.get_vectorized_dataset()
# init K-means
k = len(w_tf_idf.get_cluster_list())
labels = w_tf_idf.get_label_vector()
wkm = WikiKmeans(k, verbose=opts.verbose, mini_batch=opts.minibatch, init=opts.init)
# apply K-means
km = wkm.apply_K_means(X)

#print(labels)
#print(km.labels_)
print("Homogeneity: %0.3f" % metrics.homogeneity_score(labels, km.labels_))
print("Completeness: %0.3f" % metrics.completeness_score(labels, km.labels_))
print("V-measure: %0.3f" % metrics.v_measure_score(labels, km.labels_))
print("Adjusted Rand-Index: %.3f"
      % metrics.adjusted_rand_score(labels, km.labels_))
print("Silhouette Coefficient: %0.3f"
      % metrics.silhouette_score(X, km.labels_, sample_size=1000))

if not opts.use_hashing: