Python adasyn_sample 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: utils

메소드/함수: adasyn_sample

hotexamples.com에서의 예제들: 3

Python adasyn_sample - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 utils.adasyn_sample에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def training_sample_adasyn(df,n = 200,mincount=7):
    (X,Y) = rf_vectorizer(df)
    Xt = []
    Yt = []
    for i,cat in enumerate(np.unique(df.Y)):
        print 'adasyn :',i
        Xt.append(adasyn_sample(X,Y,cat,K=5,n=n))
        Yt.append([cat,]*Xt[-1].shape[0])
    Xt = np.vstack(Xt) 
    Yt = np.concatenate(Yt)
    shuffle = np.random.permutation(len(Yt))
    Xt = Xt[shuffle,:]
    Yt = Yt[shuffle]
    return Xt,Yt

예제 #2

파일 보기

파일: nn_training.py 프로젝트: yeonmin/kaggle

def training_sample_adasyn(df,vec,N = 200,mincount=7):
    X = vec.transform(df.txt)
    Y = df.Categorie3.values
    Xt = []
    Yt = []
    for i,cat in enumerate(np.unique(Y)):
        print 'adasyn :',i
        Xt.append(adasyn_sample(X,Y,cat,K=5,n=N))
        Yt.append([cat,]*Xt[-1].shape[0])
    Xt = np.vstack(Xt) 
    Yt = np.concatenate(Yt)
    shuffle = np.random.permutation(len(Yt))
    Xt = Xt[shuffle,:]
    Yt = Yt[shuffle]
    return Xt,Yt

예제 #3

파일 보기

dfsample.to_csv(ddir+'training_sup9.csv',sep=';',index=False,header=False)

Y = dfsample.Categorie3.values
ID = dfsample.Identifiant_Produit.values
print 'vectorizing...'
vec,X = vectorizer(dfsample.txt)
print 'dumping...'
joblib.dump((vec,ID,X,Y),ddir+'joblib/vecIDXY')

# use adasyn to get synthetic balanced dataset

Xt = []
Yt = []
for i,cat in enumerate(np.unique(Y)):
    print 'adasyn :',i
    Xt.append(adasyn_sample(X,Y,cat,K=5,n=200))
    Yt.append([cat,]*Xt[-1].shape[0])

Xt = sparse.vstack(Xt) 
assert Xt.shape[0] == len(Yt)
rows = random.sample(Xt,Xt.shape[0])
Xt = Xt[rows]
joblib.dump((vec,Xt,Yt),ddir+'joblib/vecXtYt')

#################################################
# TRAINING START HERE
#################################################


(vec,X,Y) = joblib.load(ddir+'joblib/vecXtYt_200')
Z = np.array(map(lambda c:cat3tocat1[c],Y))