Python get_stylometric_features_by_author_id 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: data_analysis.data_warehouse

메소드/함수: get_stylometric_features_by_author_id

hotexamples.com에서의 예제들: 3

Python get_stylometric_features_by_author_id - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 data_analysis.data_warehouse.get_stylometric_features_by_author_id에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: cross_validate.py 프로젝트: CityUHKDB/pladetect_py

import numpy as np
from data_analysis import data_warehouse
from sklearn.cross_validation import KFold

author_list = []
feature_list = []

t1 = data_warehouse.get_stylometric_features_by_author_id(1) # 1
feature_list.extend(t1)
author_list.extend([0 for x in range(len(t1))])

t2 = data_warehouse.get_stylometric_features_by_author_id(2) # 2
feature_list.extend(t2)
author_list.extend([1 for x in range(len(t2))])

t3 = data_warehouse.get_stylometric_features_by_author_id(3) # 3
feature_list.extend(t3)
author_list.extend([2 for x in range(len(t3))])

X = np.array(feature_list)
y = np.array(author_list)

kf = KFold(len(feature_list), n_folds=3)
print len(feature_list)
print len(author_list)
print len(kf)

for train_index, test_index in kf:
    print ("TRAIN: ", train_index, "TEST: ", test_index)
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]

예제 #2

파일 보기

파일: knn_cross_validate.py 프로젝트: CityUHKDB/pladetect_py

import time
import numpy as np
from data_analysis import data_warehouse
from sklearn import cross_validation
from sklearn.metrics import classification_report, accuracy_score
from data_analysis import calculate_K_nearest_neighbors_classifier_for_sets as KNN


start_time = time.time()

author_list = []
feature_list = []

for i in range(1, 20):
    temp_arr = data_warehouse.get_stylometric_features_by_author_id(i) # 3
    feature_list.extend(temp_arr)
    author_list.extend([i for x in range(len(temp_arr))])

X_train, X_test, y_train, y_test = cross_validation.train_test_split(feature_list, author_list, test_size=0.1, random_state=1)

train = np.array(zip(X_train, y_train))
test = np.array(zip(X_test, y_test))

predictions = []


print 'Finished getting data from the database'
#print CKNN.get_knn_classifier_cross_validation(X, y)
for idx in range(len(X_test)):
    print 'Classifying test instance number ', str(idx) + ':'
    neighbors = KNN.get_set_neighbor(training_set=train, test_instance=test[idx][0], k=5)

예제 #3

파일 보기

import numpy as np
from data_analysis import data_warehouse
from sklearn.cross_validation import KFold

author_list = []
feature_list = []

t1 = data_warehouse.get_stylometric_features_by_author_id(1)  # 1
feature_list.extend(t1)
author_list.extend([0 for x in range(len(t1))])

t2 = data_warehouse.get_stylometric_features_by_author_id(2)  # 2
feature_list.extend(t2)
author_list.extend([1 for x in range(len(t2))])

t3 = data_warehouse.get_stylometric_features_by_author_id(3)  # 3
feature_list.extend(t3)
author_list.extend([2 for x in range(len(t3))])

X = np.array(feature_list)
y = np.array(author_list)

kf = KFold(len(feature_list), n_folds=3)
print len(feature_list)
print len(author_list)
print len(kf)

for train_index, test_index in kf:
    print("TRAIN: ", train_index, "TEST: ", test_index)
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]