Python KMeansModel.predict 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: pyspark.mllib.clustering

클래스/타입: KMeansModel

메소드/함수: predict

hotexamples.com에서의 예제들: 4

Python KMeansModel.predict - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 pyspark.mllib.clustering.KMeansModel.predict에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

load(30)

KMeansModel(10)

predict(4)

자주 사용되는 메소드들

load (30)

KMeansModel (10)

predict (4)

예제 #1

파일 보기

def assign_pooling(data):

    image_name, feature_matrix = data[0]
    clusterCenters = data[1]

    feature_matrix = np.array(feature_matrix)

    model = KMeansModel(clusterCenters)
    bow = np.zeros(len(clusterCenters))

    for x in feature_matrix:
        k = model.predict(x)
        dist = distance.euclidean(clusterCenters[k], x)
        bow[k] = max(bow[k], dist)

    clusters = bow.tolist()
    group = clusters.index(min(clusters)) + 1
    return [image_name, group]

예제 #2

파일 보기

파일: imageSequentialClustering.py 프로젝트: oadekoya/sparkforImageProcessing

def assign_pooling(row, clusterCenters, pooling):
    image_name = row['fileName']
    feature_matrix = np.array(row['features'])
    clusterCenters = clusterCenters.value
    model = KMeansModel(clusterCenters)
    bow = np.zeros(len(clusterCenters))

    for x in feature_matrix:
        k = model.predict(x)
        dist = distance.euclidean(clusterCenters[k], x)
        if pooling == "max":
            bow[k] = max(bow[k], dist)
        elif pooling == "sum":
            bow[k] = bow[k] + dist
    clusters = bow.tolist()
    group = clusters.index(min(clusters)) + 1
    #print(image_name + " in group: " + str(group))
    return [(image_name, group)]

예제 #3

파일 보기

파일: oldImageClustering.py 프로젝트: hsabiu/thesis-scripts

def assign_pooling(data):

    row = data[0]
    clusterCenters = data[1]
    pooling = data[2]

    image_name = row['fileName']
    feature_matrix = np.array(row['features'])

    model = KMeansModel(clusterCenters)
    bow = np.zeros(len(clusterCenters))

    for x in feature_matrix:
        k = model.predict(x)
        dist = distance.euclidean(clusterCenters[k], x)
        if pooling == "max":
            bow[k] = max(bow[k], dist)
        elif pooling == "sum":
            bow[k] = bow[k] + dist
    clusters = bow.tolist()
    group = clusters.index(min(clusters)) + 1
    return [image_name, group]

예제 #4

파일 보기

ref = []
minIndex, minValue = min(enumerate(totalDist), key=operator.itemgetter(1))
ref = perm[minIndex]

# dataPoint = []
correct = 0
incorrect = 0
with open('/home/ronald/data.csv', 'r') as f:
    csvReader = csv.DictReader(f)
    for row in csvReader:
        data = []
        for i in row:
            if i != 'target':
                data.append(row[i])
        if ref[model.predict(Vectors.dense(data))] == int(row['target']):
            correct += 1
        else:
            # print(str(ref[model.predict(Vectors.dense(data))])+' '+str(row['target']))
            incorrect += 1
        # dataPoint.append(data)

print(str(correct / (incorrect + correct) * 100) + '%')

centers = []
with open('/home/ronald/kmeansModel', 'r') as f:
    line = f.readline()
    while line:
        centers.append(line)
        line = f.readline()