/
TG_MLP_OLS_AUTOMATIZADO.py
387 lines (315 loc) · 14.6 KB
/
TG_MLP_OLS_AUTOMATIZADO.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
# -*- coding: utf-8 -*-
"""
Created on Sun Mar 22 21:43:49 2020
@author: pamsb
"""
#redes neurais artificiais
from sklearn.neural_network import MLPRegressor
import numpy as np
import matplotlib.pylab as plt
#matplotlib.pylab inline
from matplotlib.pylab import rcParams
rcParams['figure.figsize']=15,6
import pandas as pd
from scipy.stats import pearsonr
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, LSTM
from keras.wrappers.scikit_learn import KerasRegressor
from sklearn.model_selection import cross_val_score, TimeSeriesSplit, cross_val_predict
from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error, make_scorer
from sklearn.preprocessing import MinMaxScaler
import math
dateparse=lambda dates: pd.datetime.strptime(dates, '%Y-%m')
df = pd.read_csv('Matriz_vazao_regress.csv', sep=';', parse_dates=['Month'], index_col='Month', date_parser =dateparse)
dataprep=df.iloc[:,13:14]
data=dataprep.values
data = data.astype('float32')
scaler = MinMaxScaler(feature_range=(0,1))
data = scaler.fit_transform(data)
splits = TimeSeriesSplit(n_splits=2)
plt.figure(1)
index = 1
for train_index, test_index in splits.split(data):
train = data[train_index]
test = data[test_index]
print('Observations: %d' % (len(train) + len(test)))
print('Training Observations: %d' % (len(train)))
print('Testing Observations: %d' % (len(test)))
plt.subplot(310 + index)
plt.plot(train)
plt.plot([None for i in train] + [x for x in test])
index += 1
plt.show()
resultados_mlp = np.zeros((13,13))
resultados_rl = np.zeros((13,13))
# resultados_rl_r2 = []
# resultados_rl_rmse = []
# resultados_rl_mae =[]
# resultados_rl_crossval=[]
# resultados_mlp_r2 = []
# resultados_mlp_rmse = []
# resultados_mlp_mae =[]
# resultados_mlp_crossval=[]
# resultados_mlp_r2_predict=[]
# resultados_mlp_mae_predict=[]
# resultados_mlp_mse_predict=[]
for lags in range(1,13):
print("Iniciando Loop, Lag:" + str(lags))
def prepare_data(data, lags):
X,y = [],[]
for row in range(len(data)-lags-1):
a = data[row:(row+lags),0]
X.append(a)
y.append(data[row-lags,0])
return np.array(X),np.array(y)
# lags =12
X_train,y_train = prepare_data(train,lags)
X_test,y_test = prepare_data(test,lags)
y_true = y_test
plt.plot(y_test, label='Dados Originais de Vazão | y ou t+1', color ='blue')
plt.plot(X_test, label='Dados Passados | X ou t', color='orange')
plt.legend(loc='upper left')
plt.title('Dados passados em um período')
plt.show()
X_train = np.reshape(X_train, (X_train.shape[0],X_train.shape[1]))
X_test = np.reshape(X_test, (X_test.shape[0],X_test.shape[1]))
def mycustomscorer(y_test, prediction):
mycustomscorer, _ = pearsonr(y_test, prediction)
return mycustomscorer
print("Criando função especial para cáluclo de pearson")
my_scorer = make_scorer(mycustomscorer, greater_is_better=True)
def create_model():
#create model
model = Sequential()
model.add(Dense(25,input_dim=lags, activation='softplus'))
model.add(Dense(1))
model.compile(loss='mean_squared_error', optimizer='adam')
return model
# train_predict = model.predict(X_train)
# test_predict = model.predict(X_test)
print("Rodando Modelo")
model = KerasRegressor(build_fn=create_model, epochs=1000, batch_size=10, verbose=0)
print("Criando crossval de resultados")
mlp_r2_train = cross_val_score(model, X_train, y_train, cv=splits, scoring=my_scorer)
mlp_r2_test = cross_val_score(model, X_test, y_test, cv=splits, scoring=my_scorer)
mlp_mse_train = cross_val_score(model, X_train, y_train, cv=splits, scoring='neg_mean_squared_error')
mlp_mae_train = cross_val_score(model, X_train, y_train, cv=splits, scoring='neg_mean_absolute_error')
mlp_mse_test = cross_val_score(model, X_test, y_test, cv=splits, scoring='neg_mean_squared_error')
mlp_mae_test = cross_val_score(model, X_test, y_test, cv=splits, scoring='neg_mean_absolute_error')
# mlp_r2=r2_score(y_test,test_predict)
print("Alinhando Modelo")
model.fit(X_train, y_train)
print("Prevendo para dados de teste")
prediction = model.predict(X_test)
# calculate Pearson's correlation
mlp_r2_predict, _ = pearsonr(y_test, prediction)
mlp_mse_predict = mean_squared_error(y_test, prediction)
mlp_mae_predict = mean_absolute_error(y_test, prediction)
# resultados_mlp[0,0] = "Lag"
# resultados_mlp[0,1] = "R-Pearson treino crossval"
# resultados_mlp[0,2] = "R-Pearson teste crossval"
# resultados_mlp[0,2] = "R-Pearson teste"
# resultados_mlp[0,3] = "MSE treino crossval"
# resultados_mlp[0,4] = "MSE teste crossval"
# resultados_mlp[0,5] = "MAE treino crossval"
# resultados_mlp[0,6] = "MAE teste crossval"
# resultados_mlp[0,7] = "MSE teste"
# resultados_mlp[0,8] = "MAE teste"
print("Criando array de resultados")
resultados_mlp[lags,0] = lags
resultados_mlp[lags,1] = mlp_r2_train.mean()
resultados_mlp[lags,2] = mlp_r2_test.mean()
resultados_mlp[lags,3] = mlp_r2_predict
resultados_mlp[lags,4] = mlp_mse_train.mean()
resultados_mlp[lags,5] = mlp_mse_test.mean()
resultados_mlp[lags,6] = mlp_mae_train.mean()
resultados_mlp[lags,7] = mlp_mae_test.mean()
resultados_mlp[lags,8] = mlp_mse_predict
resultados_mlp[lags,9] = mlp_mae_predict
print(resultados_mlp)
# resultados_mlp_r2_predict.append(mlp_r2_predict)
# resultados_mlp_r2_predict.append(mlp_r2_train)
# resultados_mlp_r2_predict.append(mlp_r2_test)
# resultados_mlp_mae_predict.append(mlp_rmse_predict)
# resultados_mlp_mse_predict.append(mlp_mae_predict)
# resultados_mlp_r2.append(mlp_r2_train)
# resultados_mlp_r2.append(mlp_r2_test)
# resultados_mlp_rmse.append(mlp_mse)
# resultados_mlp_mae.append(mlp_mae)
# train_predict_plot =np.empty_like(data)
# train_predict_plot[:,:]=np.nan
# train_predict_plot[lags:len(train_predict)+lags,:]=train_predict
# test_predict_plot =np.empty_like(data)
# test_predict_plot[:,:]=np.nan
# test_predict_plot[len(train_predict)+(lags*2)+1:len(data)-1,:]=test_predict
# plt.plot(data, label='Observado', color='blue')
# plt.plot(train_predict_plot, label='Previsão para os dados de treino', color='red', alpha=0.5)
# plt.plot(test_predict_plot, label='Previsão para os dados de teste', color='yellow')
# plt.legend(loc='best')
# plt.show
# plt.savefig('Grafico MLP Lag' + str(lags) +'.png')
from sklearn.linear_model import LinearRegression
rl = LinearRegression().fit(X_train,y_train)
rl_trainscore =rl.score(X_train, y_train)
rl_testscore=rl.score(X_test, y_test)
rl_predicttest =rl.predict(X_test)
rl_predicttrain =rl.predict(X_train)
rl_r2=pearsonr(y_test, rl_predicttest)
# rl_r2=r2_score(y_test,rl_predicttest)
# rl_rmse = mean_squared_error(y_test, rl_predicttest)
# rl_mae = mean_absolute_error(y_test, rl_predicttest)
print("Iniciando Regressão Linear")
rl_r2_train = cross_val_score(rl, X_train, y_train, cv=splits, scoring=my_scorer)
rl_r2_test = cross_val_score(rl, X_test, y_test, cv=splits, scoring=my_scorer)
rl_mse_train = cross_val_score(rl, X_train, y_train, cv=splits, scoring='neg_mean_squared_error')
rl_mae_train = cross_val_score(rl, X_train, y_train, cv=splits, scoring='neg_mean_absolute_error')
rl_mse_test = cross_val_score(rl, X_test, y_test, cv=splits, scoring='neg_mean_squared_error')
rl_mae_test = cross_val_score(rl, X_test, y_test, cv=splits, scoring='neg_mean_absolute_error')
rl_mse_predict=mean_squared_error(y_test,rl_predicttest)
rl_mae_predict=mean_absolute_error(y_test,rl_predicttest)
print("Criando array de resultados da regressão")
resultados_rl[lags,0] = lags
resultados_rl[lags,1] = rl_r2_train.mean()
resultados_rl[lags,2] = rl_r2_test.mean()
resultados_rl[lags,3] = rl_r2[0]
resultados_rl[lags,4] = rl_mse_train.mean()
resultados_rl[lags,5] = rl_mse_test.mean()
resultados_rl[lags,6] = rl_mae_train.mean()
resultados_rl[lags,7] = rl_mae_test.mean()
resultados_rl[lags,8] = rl_mse_predict
resultados_rl[lags,9] = rl_mae_predict
print(resultados_rl)
rl_predicttest = scaler.inverse_transform(rl_predicttest.reshape(-1,1))
mlp_predicttest = scaler.inverse_transform(prediction.reshape(-1,1))
y_test = scaler.inverse_transform(y_test.reshape(-1,1))
plt.title("LAG " + str(lags))
plt.plot(y_test, label ='Observado', color='orange')
plt.plot(rl_predicttest, label ='Previsão para dados de teste usando OLS', color='red')
plt.plot(mlp_predicttest, label='Previsão para dados de teste usando MLP', color='blue')
plt.legend(loc='best')
plt.savefig('Grafico Lag' + str(lags) +'.png')
resultados_mlp.tofile("Resultados MLP_25.csv", sep=';')
resultados_rl.tofile("Resultados RL_25.csv", sep=';')
print("Salvando resultados no arquivo")
# resultados_mlp_r2_predict = np.array(resultados_mlp_r2_predict)
# resultados_mlp_mae_predict = np.array(resultados_mlp_mae_predict)
# resultados_mlp_mse_predict =np.array(resultados_mlp_mse_predict)
# resultados_rl_crossval = np.array(resultados_rl_crossval)
# resultados_rl_r2 = np.array(resultados_rl_r2)
# resultados_rl_rmse = np.array(resultados_rl_rmse)
# resultados_rl_mae=np.array(resultados_rl_mae)
# resultados_mlp_rmse = np.array(resultados_mlp_rmse)
# resultados_mlp_r2 = np.array(resultados_mlp_r2)
# resultados_mlp_mae=np.array(resultados_mlp_mae)
# resultados_mlp_r2_predict.tofile('Resultados R2 MLP predict lag.csv', sep=';')
# resultados_mlp_mae_predict.tofile('Resultados MAE MLP predict lag.csv', sep=';')
# resultados_mlp_mse_predict.tofile('Resultados MSE MLP predict lag.csv', sep=';')
# resultados_mlp_r2.tofile('Resultados R2 MLP lag.csv', sep=';')
# resultados_mlp_rmse.tofile('Resultados RMSE MLP lag.csv', sep=';')
# resultados_mlp_mae.tofile('Resultados MAE MLP lag.csv', sep=';')
# resultados_rl_crossval.tofile('Resultados CrossValScore OLS lag.csv', sep=';')
# resultados_rl_r2.tofile('Resultados R2 OLS lag.csv', sep=';')
# resultados_rl_rmse.tofile('Resultados RMSE OLS Lag.csv', sep=';')
# resultados_rl_mae.tofile('Resultados MAE OLS lag.csv', sep=';')
# rl_train_predict_plot =np.empty_like(data)
# rl_train_predict_plot[:,:]=np.nan
# rl_train_predict_plot[lags:len(rl_predicttrain)+lags,:]=rl_predicttrain
# rl_test_predict_plot =np.empty_like(data)
# rl_test_predict_plot[:,:]=np.nan
# rl_test_predict_plot[len(rl_predicttest)+(lags*2)+1:len(data)-1,:]=rl_predicttest
# plt.plot(data, label='Observado', color='blue')
# plt.plot(rl_train_predict_plot, label='Previsão para os dados de treino', color='red', alpha=0.5)
# plt.plot(rl_test_predict_plot, label='Previsão para os dados de teste', color='yellow')
# plt.legend(loc='best')
# plt.show
# plt.savefig('Grafico OLS Lag' + str(lags) +'.png')
plt.figure()
plt.plot(resultados_mlp[:,0], resultados_mlp[:,1], color='blue', label="R-Pearson para MLP" )
plt.plot(resultados_rl[:,0], resultados_rl[:,1], color='red', label="R-Pearson para OLS" )
plt.xlabel("LAG")
plt.ylabel("R-Pearson treino")
plt.title("R-Pearson OLS x R-Pearson MLP")
plt.legend(loc='best')
plt.savefig('Grafico R-PEARSON TREINO.png')
plt.show()
plt.close()
plt.figure()
plt.plot(resultados_mlp[:,0], resultados_mlp[:,2], color='blue', label="R-Pearson para MLP" )
plt.plot(resultados_rl[:,0], resultados_rl[:,2], color='red', label="R-Pearson para OLS" )
plt.xlabel("LAG")
plt.ylabel("R-Pearson teste")
plt.title("R-Pearson OLS x R-Pearson MLP")
plt.legend(loc='best')
plt.savefig('Grafico R-PEARSON TESTE.png')
plt.show()
plt.close()
plt.figure()
plt.plot(resultados_mlp[:,0], resultados_mlp[:,3], color='blue', label="R-Pearson para MLP" )
plt.plot(resultados_rl[:,0], resultados_rl[:,3], color='red', label="R-Pearson para OLS" )
plt.xlabel("LAG")
plt.ylabel("R-Pearson teste sem crossval")
plt.title("R-Pearson OLS x R-Pearson MLP")
plt.legend(loc='best')
plt.savefig('Grafico R-PEARSON TESTE SEM CROSSVAL.png')
plt.show()
plt.close()
plt.figure()
plt.plot(resultados_mlp[:,0], resultados_mlp[:,4], color='blue', label="MSE para MLP" )
plt.plot(resultados_rl[:,0], resultados_rl[:,4], color='red', label="MSE para OLS" )
plt.xlabel("LAG")
plt.ylabel("MSE treino")
plt.title("MSE OLS x MSE MLP")
plt.legend(loc='best')
plt.savefig('Grafico MSE TREINO.png')
plt.show()
plt.close()
plt.figure()
plt.plot(resultados_mlp[:,0], resultados_mlp[:,5], color='blue', label="MSE para MLP" )
plt.plot(resultados_rl[:,0], resultados_rl[:,5], color='red', label="MSE para OLS" )
plt.xlabel("LAG")
plt.ylabel("MSE teste")
plt.title("MSE OLS x MSE MLP")
plt.legend(loc='best')
plt.savefig('Grafico MSE TESTE.png')
plt.show()
plt.close()
plt.figure()
plt.plot(resultados_mlp[:,0], resultados_mlp[:,6], color='blue', label="MAE para MLP" )
plt.plot(resultados_rl[:,0], resultados_rl[:,6], color='red', label="MAE para OLS" )
plt.xlabel("LAG")
plt.ylabel("MAE treino")
plt.title("MAE OLS x MAE MLP")
plt.legend(loc='best')
plt.savefig('Grafico MAE TREINO.png')
plt.show()
plt.close()
plt.figure()
plt.plot(resultados_mlp[:,0], resultados_mlp[:,7], color='blue', label="MAE para MLP" )
plt.plot(resultados_rl[:,0], resultados_rl[:,7], color='red', label="MAE para OLS" )
plt.xlabel("LAG")
plt.ylabel("MAE teste")
plt.title("MAE OLS x MAE MLP")
plt.legend(loc='best')
plt.savefig('Grafico MAE TESTE.png')
plt.show()
plt.close()
plt.figure()
plt.plot(resultados_mlp[:,0], resultados_mlp[:,8], color='blue', label="MSE para MLP" )
plt.plot(resultados_rl[:,0], resultados_rl[:,8], color='red', label="MSE para OLS" )
plt.xlabel("LAG")
plt.ylabel("MSE teste")
plt.title("MSE OLS x MAE MLP")
plt.legend(loc='best')
plt.savefig('Grafico MSE TESTE sem crossval.png')
plt.show()
plt.close()
plt.figure()
plt.plot(resultados_mlp[:,0], resultados_mlp[:,9], color='blue', label="MAE para MLP" )
plt.plot(resultados_rl[:,0], resultados_rl[:,9], color='red', label="MAE para OLS" )
plt.xlabel("LAG")
plt.ylabel("MAE teste")
plt.title("MAE OLS x MAE MLP")
plt.legend(loc='best')
plt.savefig('Grafico MAE TESTE sem crossval.png')
plt.show()
plt.close()