Python generate_train_test_data Beispiele, process_data.generate_train_test_data Python Beispiele

Beispiel #1

0

Datei anzeigen

def get_svr_result():
    model = get_svr_model()
    path = 'test_data'
    data = generate_train_test_data(0.8, path, 9)
    for key, val in data.items():
        x_train, y_train = val[0][0], val[0][1]
        x_test, y_test = val[1][0], val[1][1]
        x_train = x_train.values
        x_test = x_test.values
        y_train = np.array(y_train.values).ravel()
        y_test = y_test.values.ravel()
        model.fit(x_train, y_train)
        y_predict = []
        time_spend = []
        time_dict = defaultdict(list)
        pre_dict = defaultdict(list)
        for x, y_t, id_name in zip(x_test, y_test, val[2]):
            start = timeit.default_timer()
            y = model.predict([x])
            spend = timeit.default_timer() - start
            time_spend.append(spend)
            acc = 1 - abs((y[0] - y_t) / y_t)
            pre_dict[id_name].append(acc)
            time_dict[id_name].append(spend)
            y_predict.append(y[0])
        df = pd.DataFrame(pre_dict)
        tm = pd.DataFrame(time_dict)
        tm = tm.astype('str')
        save_into_csv(key + "_svr", "new_result", df)
        save_into_csv(key + "_svr_time", "new_result", tm)

Beispiel #2

0

Datei anzeigen

def lstm_point_predict(path, window_size, train_set_size, point, length):
    model = get_lstm_model()
    path1 = './processed_data/' + path + '.csv'
    df = pd.read_csv(path1)

    for len in window_size:
        path1 = path + '.csv'
        data = generate_train_test_data(0.8, path1, len)
        time_dict = defaultdict(list)
        pre_dict = defaultdict(list)
        train_dict = defaultdict(list)
        for key, val in data.items():
            x_train, y_train = val[0][0], val[0][1]
            x_test, y_test = val[1][0], val[1][1]
            x_train = x_train.values
            x_test = x_test.values
            y_train = np.array(y_train.values).ravel()
            y_test = y_test.values.ravel()
            start = timeit.default_timer()
            model = train_lstm(model, x_train[:train_set_size],
                               y_train[:train_set_size], key, len, 1, 0.1)
            spend = timeit.default_timer() - start

        for column in df.columns:
            train_dict[column] = [spend]
            df[column] = df[column].fillna(0.0001)
            for i in range(length):
                x_train, y_train = df[column][point + i - len - 10:point + i -
                                              10], df[column][point + i]
                x_test, y_test = df[column][point + i - len - 10:point + i -
                                            10], df[column][point + i]
                x_train = x_train.values
                x_test = x_test.values
                y_train = np.array(y_train).ravel()
                y_test = y_test.ravel()
                y_predict = []
                time_spend = []
                time_train = defaultdict(list)
                start = timeit.default_timer()
                x = np.array([x_test]).reshape(1, len, 1)
                y = lstm_predict(x, model)
                spend = timeit.default_timer() - start
                time_spend.append(spend)
                acc = 1 - abs((y[0] - y_train) / y_train + 0.001)
                pre_dict[column].append(acc)
                time_dict[column].append(spend)
                y_predict.append(y[0])
        df1 = pd.DataFrame(pre_dict)
        tm = pd.DataFrame(time_dict)
        tt = pd.DataFrame(train_dict)
        print("<<<<<<<<<<<<<<<save result:" + path + "_lstm")
        save_into_csv(path + str(len) + "_lstm", "new_predict", df1)
        print("<<<<<<<<<<<<<<<save result:" + path + "_lstm_time")
        save_into_csv(path + str(len) + "_lstm_time", "new_predict", tm)
        print("<<<<<<<<<<<<<<<save result:" + path + "_lstm_train")
        save_into_csv(path + str(len) + "_lstm_time", "new_predict", tt)

Beispiel #3

0

Datei anzeigen

def get_lstm_result(path, lag):
    # lag = 9
    #model = get_lstm_model()
    model = Sequential()
    model.add(LSTM(input_shape=(None, 1), units=100, return_sequences=False))
    model.add(Dense(units=1))
    model.add(Activation('linear'))
    model.compile(loss='mse', optimizer='rmsprop')
    path1 = path + '.csv'
    data = generate_train_test_data(0.8, path1, lag)
    for key, val in data.items():
        x_train, y_train = val[0][0], val[0][1]
        x_test, y_test = val[1][0], val[1][1]
        x_train = x_train.values
        x_test = x_test.values
        y_train = np.array(y_train.values).ravel()
        y_test = y_test.values.ravel()
        print('x', x_train)
        model = train_lstm(model, x_train, y_train, key, lag, 32, 0.1)
        y_predict = []
        time_spend = []
        time_dict = defaultdict(list)
        pre_dict = defaultdict(list)
        for x, y_t, id_name in zip(x_test, y_test, val[2]):
            start = timeit.default_timer()
            x = x.reshape(1, lag, 1)
            y = lstm_predict(x, model)
            spend = timeit.default_timer() - start
            time_spend.append(spend)
            acc = 1 - abs((y[0] - y_t) / 1)
            #acc = 1- abs((y[0] - y_t)/(y_t + 0.001))
            pre_dict[id_name].append(acc)
            time_dict[id_name].append(spend)
            y_predict.append(y[0])
        df = pd.DataFrame()
        for key1, value in pre_dict.items():
            df = pd.concat([df, pd.DataFrame({key1: value})], axis=1)
        tm = pd.DataFrame()
        for key1, value in time_dict.items():
            tm = pd.concat([tm, pd.DataFrame({key1: value})], axis=1)

        print("<<<<<<<<<<<<<<<save result:" + key + "_lstm")
        save_into_csv(path + "_lstm", "new_result", df)
        print("<<<<<<<<<<<<<<<save result:" + key + "_lstm_time")
        save_into_csv(path + "_lstm_time", "new_result", tm)

Beispiel #4

0

Datei anzeigen

def get_bayes_result(path, lag):
    model = get_bayes_model()
    path1 = path + '.csv'
    data = generate_train_test_data(0.8, path1, lag)
    for key, val in data.items():
        x_train, y_train = val[0][0], val[0][1]
        x_test, y_test = val[1][0], val[1][1]
        x_train = x_train.values
        x_test = x_test.values
        y_train = np.array(y_train.values).ravel()
        y_test = y_test.values.ravel()
        if os.path.exists("model/" + path + "_" + str(lag) + ".model"):
            joblib.load("model/" + path + "_" + str(lag) + ".model", model)
        else:
            print('train')
            model.fit(x_train, y_train)
        y_predict = []
        time_spend = []
        time_dict = defaultdict(list)
        pre_dict = defaultdict(list)
        for x, y_t, id_name in zip(x_test, y_test, val[2]):
            start = timeit.default_timer()
            y = model.predict([x])
            spend = timeit.default_timer() - start
            time_spend.append(spend)
            acc = 1 - abs((y[0] - y_t) / 1)
            #acc = 1- abs((y[0] - y_t)/(y_t + 0.001))
            pre_dict[id_name].append(acc)
            spend = format(spend, 'f')
            time_dict[id_name].append(str(spend))
            y_predict.append(y[0])

        df = pd.DataFrame()
        for key1, value in pre_dict.items():
            df = pd.concat([df, pd.DataFrame({key1: value})], axis=1)
        tm = pd.DataFrame()
        for key1, value in time_dict.items():
            tm = pd.concat([tm, pd.DataFrame({key1: value})], axis=1)

        print("<<<<<<<<<<<<<<<save result:" + key + "_bayes")
        save_into_csv(path + "_bayes", "new_result", df)
        print("<<<<<<<<<<<<<<<save result:" + key + "_bayes_time")
        save_into_csv(path + "_bayes_time", "new_result", tm)

Beispiel #5

0

Datei anzeigen

Datei: test.py Projekt: xingchennn/ML-for-load-balancing

from process_data import generate_train_test_data, save_into_csv, get_files_list
import numpy as np
#from new_model import get_bayes_model
#from new_model import get_svr_model
#from new_model import get_arima_forecast
from new_model import get_lstm_model
#from new_model import train_lstm
#from new_model import lstm_predict
import pandas as pd
import timeit
from collections import defaultdict
import statsmodels.api as sm
from sklearn.externals import joblib
import os
import result

if __name__ == "__main__":
    path = "long_term_maximum_CPU_usage.csv"
    lag = 8
    data = generate_train_test_data(0.8, path, lag)
    result.get_lstm_result(path, lag)
    print('a')

Beispiel #6

0

Datei anzeigen

def bayes_point_predict(path, window_size, train_set_size, point, length):
    model = get_bayes_model()
    path1 = 'processed_data/' + path + '.csv'
    df = pd.read_csv(path1)
    time_train = []
    for len in window_size:
        path1 = path + '.csv'
        data = generate_train_test_data(0.8, path1, len)
        for key, val in data.items():
            x_train, y_train = val[0][0], val[0][1]
            x_test, y_test = val[1][0], val[1][1]
            x_train = x_train.values
            x_test = x_test.values
            y_train = np.array(y_train.values).ravel()
            y_test = y_test.values.ravel()
            if os.path.exists("model/" + path + "_" + str(train_set_size) +
                              ".model"):
                joblib.load(
                    "model/" + path + "_" + str(train_set_size) + ".model",
                    model)
            else:
                print('train')
                start = timeit.default_timer()
                model.fit(x_train[:train_set_size], y_train[:train_set_size])
                spend = timeit.default_timer() - start
                time_train.append(spend)
        y_predict = []
        time_spend = []

        train_dict = defaultdict(list)
        pre_dict = defaultdict(list)
        time_dict = defaultdict(list)
        for column in df.columns:
            # model = get_bayes_model()
            if df[column].size < point + length:
                print('no such point')
                continue
            df[column] = df[column].fillna(0.00001)
            # x_train, y_train = df[column][point - len - 10: point - 10], df[column][point]
            for i in range(length):
                x_test, y_test = df[column][point + i - len - 10:point + i -
                                            10], df[column][point + i]
                # x_train = x_train.values
                # print(x_train)
                x_test = x_test.values
                # y_train = np.array(y_train).ravel()
                y_test = y_test.ravel()
                start = timeit.default_timer()
                y = model.predict([x_test])
                spend = timeit.default_timer() - start
                time_spend.append(spend)
                #acc = 1 - abs((y[0] - y_test) / (y_test + 0.001))
                acc = 1 - abs((y[0] - y_test) / 1)
                pre_dict[column].append(acc)
                spend = format(spend, 'f')
                time_dict[column].append(str(spend))
                train_dict[column].append(str(time_train[0]))
                y_predict.append(y[0])
        df1 = pd.DataFrame(pre_dict)
        tm = pd.DataFrame(time_dict)
        tt = pd.DataFrame(train_dict)
        print("<<<<<<<<<<<<<<<save result:" + path + "_bayes")
        save_into_csv(path + str(len) + "_bayes", "new_predict", df1)
        print("<<<<<<<<<<<<<<<save result:" + path + "_bayes_time")
        save_into_csv(path + str(len) + "_bayes_time", "new_predict", tm)
        print("<<<<<<<<<<<<<<<save result:" + path + "_bayes_train")
        save_into_csv(path + str(len) + "_bayes_train", "new_predict", tt)