Python PenguinAggregation.__cluster_subject__ 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: penguinAggregation

클래스/타입: PenguinAggregation

메소드/함수: __cluster_subject__

hotexamples.com에서의 예제들: 13

Python PenguinAggregation.__cluster_subject__ - 13개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 penguinAggregation.PenguinAggregation.__cluster_subject__에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

__readin_subject__(6)

__cluster_subject__(6)

PenguinAggregation(2)

__display_raw_markings__(2)

__roc__(2)

__accuracy__(2)

__get_subjects_per_site__(2)

__num_gold_clusters__(2)

__signal_ibcc__(1)

__save_raw_markings__(1)

__readin_users__(1)

__get_status__(1)

__get_gold_subjects__(1)

__find_one__(1)

__find_closest_neighbour__(1)

__display__markings__(1)

__soy_it__(1)

예제 #1

파일 보기

파일: penguinScript1.py 프로젝트: JiaminXuan/aggregation

#!/usr/bin/env python
__author__ = 'ggdhines'
from penguinAggregation import PenguinAggregation
import random
import os
import sys

# add the paths necessary for clustering algorithm and ibcc - currently only works on Greg's computer
if os.path.exists("/home/ggdhines"):
    sys.path.append("/home/ggdhines/PycharmProjects/reduction/experimental/clusteringAlg")
else:
    sys.path.append("/home/greg/github/reduction/experimental/clusteringAlg")

from divisiveKmeans import DivisiveKmeans

clusterAlg = DivisiveKmeans().__fit__

penguin = PenguinAggregation()
subject_ids = penguin.__get_subjects_per_site__("APZ00035mv",complete=True,remove_blanks=True)

for i,subject in enumerate(random.sample(subject_ids,50)):
    print i
    penguin.__readin_subject__(subject)
    blankImage = penguin.__cluster_subject__(subject, clusterAlg)

    if not blankImage:
        penguin.__save_raw_markings__(subject)
        break

예제 #2

파일 보기

파일: checkIBCC.py 프로젝트: JiaminXuan/aggregation

clusterAlg = DivisiveKmeans().__fit__

penguin = PenguinAggregation()

gold_subjects = penguin.__get_gold_subjects__()
gold_sample = gold_subjects[:50]

penguin.__readin_users__()

for count,zooniverse_id in enumerate(gold_sample):
    if count == 50:
        break
    print count, zooniverse_id
    penguin.__readin_subject__(zooniverse_id,read_in_gold=True)

    blankImage = penguin.__cluster_subject__(zooniverse_id, clusterAlg,fix_distinct_clusters=True,correction_alg=correctionAlg)
    penguin.__soy_it__(zooniverse_id)


    penguin.__signal_ibcc__()
    penguin.__roc__()
# one_overlap = penguin.__off_by_one__(display=True)
# last_id = None
#
# for t in one_overlap:
#     if t[0] != last_id:
#         print "*****"
#         print "====="
#         last_id = t[0]
#     penguin.__relative_confusion__(t)

예제 #3

파일 보기

파일: clusterCompare.py 프로젝트: lelou6666/aggregation

Y2 = []
Z1 = []
Z2 = []
nonEmpty = 0
index = -1
random.shuffle(subject_ids)
while True:
    index += 1
    #for i,subject in enumerate(random.sample(subject_ids,50)):
    #subject = "APZ000173v"
    subject = subject_ids[index]
    #print nonEmpty,index

    penguin.__readin_subject__(
        subject, read_in_gold=True)  #,users_to_skip=["caitlin.black"])
    numClusters, time_to_cluster = penguin.__cluster_subject__(
        subject, clusterAlg)

    if numClusters == 0:
        continue

    print nonEmpty

    nonEmpty += 1
    if nonEmpty == 50:
        break
    accuracy1 = penguin.__accuracy__(subject)

    X1.append(numClusters)
    Y1.append(time_to_cluster)
    Z1.append(accuracy1)

예제 #4

파일 보기

파일: clusterCompare2.py 프로젝트: JiaminXuan/aggregation

Y2 = []
Z1 = []
Z2 = []
nonEmpty = 0
index = -1
random.shuffle(subject_ids)
while True:
    index += 1
#for i,subject in enumerate(random.sample(subject_ids,50)):
    #subject = "APZ000173v"
    subject = subject_ids[index]
    #print nonEmpty,index

    agglomerative.__readin_subject__(subject,read_in_gold=True)#,users_to_skip=["caitlin.black"])
    dkmeans.__readin_subject__(subject,read_in_gold=True)
    numClusters,time_to_cluster = agglomerative.__cluster_subject__(subject)


    if numClusters == 0:
        continue

    print nonEmpty

    nonEmpty += 1
    if nonEmpty == 30:
        break
    accuracy1 = agglomerative.__accuracy__(subject)

    X1.append(numClusters)
    Y1.append(time_to_cluster)
    Z1.append(accuracy1)

예제 #5

파일 보기

파일: penguinScript2.py 프로젝트: JiaminXuan/aggregation

from penguinAggregation import PenguinAggregation
import random
import os
import sys

# add the paths necessary for clustering algorithm and ibcc - currently only works on Greg's computer
if os.path.exists("/home/ggdhines"):
    sys.path.append("/home/ggdhines/PycharmProjects/reduction/experimental/clusteringAlg")
else:
    sys.path.append("/home/greg/github/reduction/experimental/clusteringAlg")

from divisiveKmeans import DivisiveKmeans

clusterAlg = DivisiveKmeans().__fit__

penguin = PenguinAggregation()
zooniverse_id_list = random.sample(penguin.__get_subjects_per_site__("APZ0001x3p"),40)

for i,zooniverse_id in enumerate(zooniverse_id_list):
    print i
    penguin.__readin_subject__(zooniverse_id)
    blankImage = penguin.__cluster_subject__(zooniverse_id, clusterAlg)

    if not blankImage:
        print "+--"
        penguin.__find_closest_neighbour__(zooniverse_id)

#penguin.__plot_cluster_size__(zooniverse_id_list)
penguin.__find_one__(zooniverse_id_list)

예제 #6

파일 보기

파일: clusterCompare2.py 프로젝트: lelou6666/aggregation

Z1 = []
Z2 = []
nonEmpty = 0
index = -1
random.shuffle(subject_ids)
while True:
    index += 1
    #for i,subject in enumerate(random.sample(subject_ids,50)):
    #subject = "APZ000173v"
    subject = subject_ids[index]
    #print nonEmpty,index

    agglomerative.__readin_subject__(
        subject, read_in_gold=True)  #,users_to_skip=["caitlin.black"])
    dkmeans.__readin_subject__(subject, read_in_gold=True)
    numClusters, time_to_cluster = agglomerative.__cluster_subject__(subject)

    if numClusters == 0:
        continue

    print nonEmpty

    nonEmpty += 1
    if nonEmpty == 20:
        break
    accuracy1 = agglomerative.__accuracy__(subject)

    X1.append(numClusters)
    Y1.append(time_to_cluster)
    Z1.append(accuracy1)

예제 #7

파일 보기

import random
import os
import sys

# add the paths necessary for clustering algorithm and ibcc - currently only works on Greg's computer
if os.path.exists("/home/ggdhines"):
    sys.path.append(
        "/home/ggdhines/PycharmProjects/reduction/experimental/clusteringAlg")
else:
    sys.path.append("/home/greg/github/reduction/experimental/clusteringAlg")

from divisiveKmeans import DivisiveKmeans

clusterAlg = DivisiveKmeans().__fit__

penguin = PenguinAggregation()
zooniverse_id_list = random.sample(
    penguin.__get_subjects_per_site__("APZ0001x3p"), 40)

for i, zooniverse_id in enumerate(zooniverse_id_list):
    print i
    penguin.__readin_subject__(zooniverse_id)
    blankImage = penguin.__cluster_subject__(zooniverse_id, clusterAlg)

    if not blankImage:
        print "+--"
        penguin.__find_closest_neighbour__(zooniverse_id)

#penguin.__plot_cluster_size__(zooniverse_id_list)
penguin.__find_one__(zooniverse_id_list)

예제 #8

파일 보기

파일: clusterCompare.py 프로젝트: alexbfree/aggregation

X2 = []
Y2 = []
Z1 = []
Z2 = []
nonEmpty = 0
index = -1
random.shuffle(subject_ids)
while True:
    index += 1
    # for i,subject in enumerate(random.sample(subject_ids,50)):
    # subject = "APZ000173v"
    subject = subject_ids[index]
    # print nonEmpty,index

    penguin.__readin_subject__(subject, read_in_gold=True)  # ,users_to_skip=["caitlin.black"])
    numClusters, time_to_cluster = penguin.__cluster_subject__(subject, clusterAlg)

    if numClusters == 0:
        continue

    print nonEmpty

    nonEmpty += 1
    if nonEmpty == 50:
        break
    accuracy1 = penguin.__accuracy__(subject)

    X1.append(numClusters)
    Y1.append(time_to_cluster)
    Z1.append(accuracy1)

예제 #9

파일 보기

#!/usr/bin/env python
__author__ = 'ggdhines'
from penguinAggregation import PenguinAggregation
import random
import os
import sys

# add the paths necessary for clustering algorithm and ibcc - currently only works on Greg's computer
if os.path.exists("/home/ggdhines"):
    sys.path.append(
        "/home/ggdhines/PycharmProjects/reduction/experimental/clusteringAlg")
else:
    sys.path.append("/home/greg/github/reduction/experimental/clusteringAlg")

from divisiveKmeans import DivisiveKmeans

clusterAlg = DivisiveKmeans().__fit__

penguin = PenguinAggregation()
subject_ids = penguin.__get_subjects_per_site__("APZ00035mv",
                                                complete=True,
                                                remove_blanks=True)

for i, subject in enumerate(random.sample(subject_ids, 50)):
    print i
    penguin.__readin_subject__(subject)
    blankImage = penguin.__cluster_subject__(subject, clusterAlg)

    if not blankImage:
        penguin.__save_raw_markings__(subject)
        break

예제 #10

파일 보기

파일: penguinAgglomerative.py 프로젝트: lelou6666/aggregation

# add the paths necessary for clustering algorithm and ibcc - currently only works on Greg's computer
if os.path.exists("/home/ggdhines"):
    sys.path.append(
        "/home/ggdhines/PycharmProjects/reduction/experimental/clusteringAlg")
else:
    sys.path.append("/home/greg/github/reduction/experimental/clusteringAlg")

from agglomerativeClustering import Ward, TooBig

clusterAlg = Ward().__fit__

penguin = PenguinAggregation()
subject_ids = pickle.load(
    open(aggregation.base_directory + "/Databases/penguin_gold.pickle", "rb"))

for i, subject in enumerate(random.sample(subject_ids, 50)):
    #subject = "APZ000173v"
    print i, subject

    penguin.__readin_subject__(subject, users_to_skip=["caitlin.black"])
    try:
        numClusters, time = penguin.__cluster_subject__(subject, clusterAlg)
    except TooBig:
        print "too big"
        continue

    if not blankImage:
        penguin.__display_raw_markings__(subject)
        penguin.__display__markings__(subject)

예제 #11

파일 보기

        gold_dict[zooniverse_id] = pts[:]

        zooniverse_id = s["zooniverse_id"]

        width = s["metadata"]["original_size"]["width"]
        height = s["metadata"]["original_size"]["height"]

        pts = [(int(x) / (width / 1000.), int(y) / (height / 563.))
               for (x, y) in pts]

        if penguin.__get_status__(zooniverse_id) != "complete":
            continue
        penguin.__readin_subject__(zooniverse_id)

        blankImage = penguin.__cluster_subject__(zooniverse_id,
                                                 clusterAlg,
                                                 fix_distinct_clusters=True)

penguin.__roc__()
#__ibcc__2(penguin.clusterResults,penguin.users_per_subject)

# plt.plot(Xt,Yt,'.')
# plt.xlabel("Large cluster size")
# plt.ylabel("Small cluster size")
# plt.xlim((min(Xt)-0.05,max(Xt)+0.05))
# plt.ylim((min(Yt)-0.05,max(Yt)+0.05))
# plt.show()
# for i in range(1,10):
#     print sum([1 for j in Yt if i == j])
# Y = []
# yErr = []

예제 #12

파일 보기

파일: soyman.py 프로젝트: JiaminXuan/aggregation

        gold_dict[zooniverse_id] = pts[:]

        zooniverse_id = s["zooniverse_id"]

        width = s["metadata"]["original_size"]["width"]
        height = s["metadata"]["original_size"]["height"]

        pts = [(int(x)/(width/1000.),int(y)/(height/563.)) for (x,y) in pts]


        if penguin.__get_status__(zooniverse_id) != "complete":
            continue
        penguin.__readin_subject__(zooniverse_id)

        blankImage = penguin.__cluster_subject__(zooniverse_id, clusterAlg,fix_distinct_clusters=True)

penguin.__roc__()
#__ibcc__2(penguin.clusterResults,penguin.users_per_subject)

# plt.plot(Xt,Yt,'.')
# plt.xlabel("Large cluster size")
# plt.ylabel("Small cluster size")
# plt.xlim((min(Xt)-0.05,max(Xt)+0.05))
# plt.ylim((min(Yt)-0.05,max(Yt)+0.05))
# plt.show()
# for i in range(1,10):
#     print sum([1 for j in Yt if i == j])
# Y = []
# yErr = []
# X = []

예제 #13

파일 보기

파일: penguinAgglomerative.py 프로젝트: alexbfree/aggregation

import cPickle as pickle
import aggregation

# add the paths necessary for clustering algorithm and ibcc - currently only works on Greg's computer
if os.path.exists("/home/ggdhines"):
    sys.path.append("/home/ggdhines/PycharmProjects/reduction/experimental/clusteringAlg")
else:
    sys.path.append("/home/greg/github/reduction/experimental/clusteringAlg")

from agglomerativeClustering import Ward, TooBig

clusterAlg = Ward().__fit__

penguin = PenguinAggregation()
subject_ids = pickle.load(open(aggregation.base_directory + "/Databases/penguin_gold.pickle", "rb"))

for i, subject in enumerate(random.sample(subject_ids, 50)):
    # subject = "APZ000173v"
    print i, subject

    penguin.__readin_subject__(subject, users_to_skip=["caitlin.black"])
    try:
        numClusters, time = penguin.__cluster_subject__(subject, clusterAlg)
    except TooBig:
        print "too big"
        continue

    if not blankImage:
        penguin.__display_raw_markings__(subject)
        penguin.__display__markings__(subject)