Python decompositionの例、HappyML.preprocessor.decomposition Pythonの例

コード例 #1

0

ファイルを表示

# -*- coding: utf-8 -*-
"""
Created on Tue Jul 16 11:52:51 2019

@author: 俊男
"""

# In[] Preprocessing
import HappyML.preprocessor as pp

# Load Dataset
dataset = pp.dataset(file="Position_Salaries.csv")

# Decomposition of Variables
X, Y = pp.decomposition(dataset, x_columns=[1], y_columns=[2])

# Training / Testing Set
X_train, X_test, Y_train, Y_test = pp.split_train_test(x_ary=X,
                                                       y_ary=Y,
                                                       train_size=0.8)

# Feature Scaling
#X = pp.feature_scaling(fit_ary=X, transform_arys=(X))
#Y = pp.feature_scaling(fit_ary=Y, transform_arys=(Y))

# In[] Linear Regression as comparison
from HappyML.regression import SimpleRegressor
import HappyML.model_drawer as md

reg_simple = SimpleRegressor()
Y_simple = reg_simple.fit(x_train=X, y_train=Y).predict(x_test=X)

コード例 #2

0

ファイルを表示

ファイル: Demo02_MultipleRegression.py プロジェクト: weixiang0815/pythonpractice

# -*- coding: utf-8 -*-
"""
Created on Mon Jul 15 12:21:45 2019

@author: 俊男
"""

# In[] Pre-processing
import HappyML.preprocessor as pp

# Dataset Loading
dataset = pp.dataset("50_Startups.csv")

# Independent/Dependent Variables Decomposition
X, Y = pp.decomposition(dataset, [0, 1, 2, 3], [4])

# Apply One Hot Encoder to Column[3] & Remove Dummy Variable Trap
X = pp.onehot_encoder(X, columns=[3])
X = pp.remove_columns(X, [3])
#X = pp.onehot_encoder(X, columns=[3], remove_trap=True)

# Split Training vs. Testing Set
X_train, X_test, Y_train, Y_test = pp.split_train_test(X, Y, train_size=0.8)

# Feature Scaling (optional)
#X_train, X_test = pp.feature_scaling(fit_ary=X_train, transform_arys=(X_train, X_test))
#Y_train, Y_test = pp.feature_scaling(fit_ary=Y_train, transform_arys=(Y_train, Y_test))

# In[] Create Linear Regressor
from HappyML.regression import SimpleRegressor

コード例 #3

0

ファイルを表示

ファイル: Demo04_LogisticRegression.py プロジェクト: weixiang0815/pythonpractice

# -*- coding: utf-8 -*-
"""
Created on Tue Jul 16 21:53:25 2019

@author: 俊男
"""

# In[] Preprocessing
import HappyML.preprocessor as pp

# Load Dataset
dataset = pp.dataset(file="Social_Network_Ads.csv")

# X, Y Decomposition
X, Y = pp.decomposition(dataset, x_columns=[1, 2, 3], y_columns=[4])

# Categorical Data Encoding & Remove Dummy Variable Trap
X = pp.onehot_encoder(X, columns=[0], remove_trap=True)

# Feature Selection
from HappyML.preprocessor import KBestSelector
selector = KBestSelector()
X = selector.fit(x_ary=X, y_ary=Y, verbose=True, sort=True).transform(x_ary=X)

# Split Training & Testing set
X_train, X_test, Y_train, Y_test = pp.split_train_test(X, Y)

# Feature Scaling
X_train, X_test = pp.feature_scaling(fit_ary=X_train,
                                     transform_arys=(X_train, X_test))

コード例 #4

0

ファイルを表示

# -*- coding: utf-8 -*-
"""
Created on Sun Aug  1 11:40:29 2021

@author: henry
"""

from HappyML import preprocessor as pp
from HappyML.regression import SimpleRegressor
import pandas as pd
from HappyML import model_drawer as md

dataset_h = pp.dataset("Student_Height.csv")
dataset_w = pp.dataset("Student_Weight.csv")

X_h, Y_h = pp.decomposition(dataset_h, [1], [3, 4])
X_w, Y_w = pp.decomposition(dataset_w, [1], [3, 4])

X_h_train, X_h_test, Y_h_train, Y_h_test = pp.split_train_test(X_h, Y_h)
X_w_train, X_w_test, Y_w_train, Y_w_test = pp.split_train_test(X_w, Y_w)

regressor = [[SimpleRegressor(), SimpleRegressor()],
             [SimpleRegressor(), SimpleRegressor()]]
regressor[0][0].fit(X_h_train, Y_h_train.iloc[:, 0].to_frame())
regressor[0][1].fit(X_h_train, Y_h_train.iloc[:, 1].to_frame())
regressor[1][0].fit(X_w_train, Y_w_train.iloc[:, 0].to_frame())
regressor[1][1].fit(X_w_train, Y_w_train.iloc[:, 1].to_frame())

print("台灣 6~15 歲學童身高、體重評估系統\n")
gender = eval(input("請輸入您的性別（1.男 2.女）：")) - 1
age = eval(input("請輸入您的年齡（6-15）："))

コード例 #5

0

ファイルを表示

ファイル: Demo01_K-Means_Customers.py プロジェクト: weixiang0815/pythonpractice

# -*- coding: utf-8 -*-
"""
Created on Mon Aug 26 21:20:09 2019

@author: 俊男
"""

# In[] Preprocessing
import HappyML.preprocessor as pp

# Load Dataset
dataset = pp.dataset(file="Mall_Customers.csv")

# Decomposition
X = pp.decomposition(dataset, x_columns=[1, 2, 3, 4])

# One-Hot Encoding
X = pp.onehot_encoder(ary=X, columns=[0], remove_trap=True)

# Feature Scaling (for PCA Feature Selection)
X = pp.feature_scaling(fit_ary=X, transform_arys=X)

# Feature Selection (PCA)
from HappyML.preprocessor import PCASelector

selector = PCASelector()
X = selector.fit(x_ary=X, verbose=True, plot=True).transform(x_ary=X)

# In[] K-Means Clustering with Fixed Clusters = 4 (Without HappyML)
# from sklearn.cluster import KMeans
# import time

コード例 #6

0

ファイルを表示

# -*- coding: utf-8 -*-
"""
Created on Mon Jul 15 10:10:12 2019

@author: 俊男
"""

# In[] Pre-processing
from HappyML import preprocessor as pp

# Dataset Loading
dataset = pp.dataset("Salary_Data.csv")

# Independent/Dependent Variables Decomposition
X, Y = pp.decomposition(dataset, [0], [1])

# Split Training vs. Testing Set
X_train, X_test, Y_train, Y_test = pp.split_train_test(X, Y, train_size=2 / 3)

# Feature Scaling (optional)
X_train, X_test = pp.feature_scaling(fit_ary=X_train,
                                     transform_arys=(X_train, X_test))
Y_train, Y_test = pp.feature_scaling(fit_ary=Y_train,
                                     transform_arys=(Y_train, Y_test))

# In[] Fitting Simple Regressor
# from sklearn.linear_model import LinearRegression

# regressor = LinearRegression()
# regressor.fit(X_train, Y_train)
# Y_pred = regressor.predict(X_test)

コード例 #7

0

ファイルを表示

@author: henry
"""

import HappyML.preprocessor as pp
from HappyML.clustering import KMeansCluster
import HappyML.model_drawer as md
from HappyML.classification import DecisionTree
from HappyML.performance import KFoldClassificationPerformance
from IPython.display import Image, display

dataset = pp.dataset("CreditCards.csv")

dataset = pp.missing_data(dataset)

X = pp.decomposition(dataset, [i for i in range(18) if i != 0])

X = pp.feature_scaling(X, X)

selector = pp.PCASelector(best_k=2)
X = selector.fit(X).transform(X)

cluster = KMeansCluster()
Y_pred = cluster.fit(X).predict(X, "Customer Type")

md.cluster_drawer(X, Y_pred, cluster.centroids, "Customers Segmentation",
                  "Microsoft JhengHei")

dataset = pp.combine(dataset, Y_pred)

X, Y = pp.decomposition(dataset, [i for i in range(18) if i != 0], [18])

コード例 #8

0

ファイルを表示

ファイル: DecisionTree.py プロジェクト: weixiang0815/pythonpractice

# -*- coding: utf-8 -*-
"""
Created on Mon Aug 23 20:11:45 2021

@author: henry
"""

# In[]
import HappyML.preprocessor as pp

dataset = pp.dataset(file="Mushrooms.csv")

X, Y = pp.decomposition(dataset,
                        x_columns=[i for i in range(1, 23)],
                        y_columns=[0])

X = pp.onehot_encoder(X, columns=[i for i in range(22)], remove_trap=True)
Y, Y_mapping = pp.label_encoder(Y, mapping=True)

from HappyML.preprocessor import KBestSelector

selector = KBestSelector(best_k="auto")
X = selector.fit(x_ary=X, y_ary=Y, verbose=True, sort=True).transform(x_ary=X)

X_train, X_test, Y_train, Y_test = pp.split_train_test(x_ary=X, y_ary=Y)

# In[]
from HappyML.classification import DecisionTree

classifier = DecisionTree()
Y_pred = classifier.fit(X_train, Y_train).predict(X_test)

コード例 #9

0

ファイルを表示

# -*- coding: utf-8 -*-
"""
Created on Mon Aug 30 00:22:54 2021

@author: henry
"""

import HappyML.preprocessor as pp
from HappyML.classification import SVM
from HappyML.performance import KFoldClassificationPerformance
import numpy as np
from HappyML.performance import GridSearch

# SVM without GridSearch
dataset = pp.dataset("Voice.csv")
X, Y = pp.decomposition(dataset, [i for i in range(20)], [20])
Y, Y_mapping = pp.label_encoder(Y, mapping=True)

selector = pp.KBestSelector()
X = selector.fit(X, Y, True, True).transform(X)

X_train, X_test, Y_train, Y_test = pp.split_train_test(X, Y)
X_train, X_test = pp.feature_scaling(X_train, (X_train, X_test))

classifier = SVM()
Y_pred = classifier.fit(X_train, Y_train).predict(X_test)

K = 10
kfp = KFoldClassificationPerformance(X, Y, classifier.classifier, K)

print("----- SVM Classification -----")

コード例 #10

0

ファイルを表示

ファイル: HW13.py プロジェクト: weixiang0815/pythonpractice

# -*- coding: utf-8 -*-
"""
Created on Tue Sep  7 09:57:19 2021

@author: henry
"""

import HappyML.preprocessor as pp
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
import pandas as pd
from HappyML.performance import ClassificationPerformance

dataset = pp.dataset("Churn_Modelling.csv")

X, Y = pp.decomposition(dataset, [i for i in range(3, 13)], [13])

X = pp.onehot_encoder(X, [1, 2], True)

selector = pp.KBestSelector()
X = selector.fit(X, Y, True, True).transform(X)

X_train, X_test, Y_train, Y_test = pp.split_train_test(X, Y)

X_train, X_test = pp.feature_scaling(X_train, (X_train, X_test))

classifier = Sequential()

arithmetic_mean = [0, 0]
arithmetic_mean[0] = int((X_train.shape[1] + 1) / 2)
arithmetic_mean[1] = int((arithmetic_mean[0] + 1) / 2)

コード例 #11

0

ファイルを表示

# -*- coding: utf-8 -*-
"""
Created on Sat Oct 12 23:38:01 2019

@author: 俊男
"""

# In[] Import & Load data
import HappyML.preprocessor as pp

dataset = pp.dataset(file="CarEvaluation.csv")

# In[] Decomposition
X, Y = pp.decomposition(dataset,
                        x_columns=[i for i in range(4)],
                        y_columns=[4])

# In[] Missing Data
X = pp.missing_data(X, strategy="mean")

# In[] Categorical Data Encoding

# Label Encoding
Y, Y_mapping = pp.label_encoder(Y, mapping=True)

# One-Hot Encoding
X = pp.onehot_encoder(X, columns=[0])

# In[] Split Training Set, Testing Set
X_train, X_test, Y_train, Y_test = pp.split_train_test(X,
                                                       Y,

コード例 #12

0

ファイルを表示

ファイル: HW10.py プロジェクト: weixiang0815/pythonpractice

# -*- coding: utf-8 -*-
"""
Created on Sun Aug 29 05:49:05 2021

@author: henry
"""

import HappyML.preprocessor as pp
from HappyML.classification import DecisionTree
from HappyML.performance import KFoldClassificationPerformance
import HappyML.model_drawer as md
from IPython.display import Image, display

dataset = pp.dataset("HR-Employee-Attrition.csv")

X, Y = pp.decomposition(dataset, [i for i in range(35) if i != 1], [1])
X = pp.onehot_encoder(X, [1, 3, 6, 10, 14, 16, 20, 21], True)
Y, Y_mapping = pp.label_encoder(Y, True)

selector = pp.KBestSelector()
X = selector.fit(X, Y, True, True).transform(X)

X_train, X_test, Y_train, Y_test = pp.split_train_test(X, Y)

classifier = DecisionTree()
Y_pred = classifier.fit(X_train, Y_train).predict(X_test)

K = 10
kfp = KFoldClassificationPerformance(X, Y, classifier.classifier, K)

print("----- Decision Tree Classification -----")

コード例 #13

0

ファイルを表示

ファイル: HW11.py プロジェクト: weixiang0815/pythonpractice

"""

import HappyML.preprocessor as pp
from HappyML.classification import RandomForest
from HappyML.performance import KFoldClassificationPerformance
from random import randint
import HappyML.model_drawer as md
from IPython.display import Image, display

dataset = pp.dataset("Zoo_Data.csv")
dataset_classname = pp.dataset("Zoo_Class_Name.csv")
class_names = [
    row["Class_Type"] for index, row in dataset_classname.iterrows()
]

X, Y = pp.decomposition(dataset, [i for i in range(17) if i != 0], [17])

selector = pp.KBestSelector(best_k="auto")
X = selector.fit(X, Y, sort=False).transform(X)

X_train, X_test, Y_train, Y_test = pp.split_train_test(X, Y)

classifier = RandomForest()
Y_pred = classifier.fit(X_train, Y_train).predict(X_test)

kfp = KFoldClassificationPerformance(X, Y, classifier.classifier)

print("Using KBest:")
print("----- Random Forest Classification -----")
print("{} Folds Mean Accuracy: {}".format(10, kfp.accuracy()))
print("{} Folds Mean Recall: {}".format(10, kfp.recall()))