Python load_dataset 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: evolving.util.load_dataset

메소드/함수: load_dataset

hotexamples.com에서의 예제들: 4

Python load_dataset - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 evolving.util.load_dataset.load_dataset에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: test_stream1_prequential.py 프로젝트: gaohailong/evolving_clustering

def main():
    X, y = load_dataset.load_dataset("stream1")

    # Experiment parameters
    nclusters = 4
    nsamples = 2000 * nclusters
    train_size = 800 * nclusters
    window_size = 100

    evol_model = EvolvingClustering.EvolvingClustering(macro_cluster_update=1,
                                                       variance_limit=0.001,
                                                       debug=True)
    Benchmarks.prequential_evaluation(evol_model, X, y, adjusted_rand_score,
                                      train_size, window_size)

예제 #2

파일 보기

def main():
    X, y = load_dataset.load_dataset("gaussian")
    #    X, y = load_dataset.load_dataset("s2")

    X = X[:1000, :8]
    y = y[:1000]

    standardized_X = preprocessing.scale(X)
    minmaxscaler = preprocessing.MinMaxScaler()
    minmaxscaler.fit(standardized_X)
    X = minmaxscaler.transform(standardized_X)

    evol_model = EvolvingClustering.EvolvingClustering(variance_limit=0.01,
                                                       debug=True)
    #    evol_model = EvolvingClustering2.EvolvingClustering2(rad=0.04, debug=True)
    evol_model.fit(X[:100])
    evol_model.fit(X[100:200])
    y_pred = evol_model.predict(X[:3000])

예제 #3

파일 보기

파일: test_evolving_benchmarks.py 프로젝트: gaohailong/evolving_clustering

from sklearn import preprocessing
from evolving import EvolvingClustering
from evolving.util import Metrics, load_dataset
import matplotlib.pyplot as plt
from time import time as time
from benchmarks.denstream.DenStream import DenStream

cmap = plt.cm.get_cmap('rainbow')

#X, y = load_dataset.load_dataset("s2")
#X, y = load_dataset.load_dataset("blobs", n_samples=1000, n_features=2)
X, y = load_dataset.load_dataset("gaussian")

X = X[:100, :20]
standardized_X = preprocessing.scale(X)
minmaxscaler = preprocessing.MinMaxScaler()
minmaxscaler.fit(standardized_X)
X = minmaxscaler.transform(standardized_X)

# CLUSTREAM #########################################

#clustream = CluStream(q=100, m=10, radius_factor = 1.8, delta=10, k=5, init_number=100)
#y_pred = clustream.fit_predict(X)
#y_pred[y_pred == -1] = 5

#print("Purity: %10.4f"% (Metrics.purity(y,y_pred)))
#print("Precision: %10.4f"% (Metrics.precision(y,y_pred)))
#print("Recall: %10.4f"% (Metrics.recall(y,y_pred)))

# CLUSTREAM #########################################

예제 #4

파일 보기

파일: test_monte_carlo.py 프로젝트: gaohailong/evolving_clustering

from sklearn import preprocessing
from evolving import EvolvingClustering
from evolving.util import Benchmarks, load_dataset
import numpy as np
from sklearn.metrics import adjusted_rand_score

X, y = load_dataset.load_dataset("s2")
standardized_X = preprocessing.scale(X)
minmaxscaler = preprocessing.MinMaxScaler()
minmaxscaler.fit(standardized_X)
X = minmaxscaler.transform(standardized_X)
y = np.array([el[0] for el in y])

evol_model = EvolvingClustering.EvolvingClustering(macro_cluster_update=1,
                                                   variance_limit=0.01,
                                                   debug=False)

train_size = 3000
window_size = 100
Benchmarks.monte_carlo_evaluation(evol_model,
                                  adjusted_rand_score,
                                  X[0:400],
                                  y[0:400],
                                  trials=10)