Python load_dataframe Exemples, functions.load_dataframe Python Exemples

Exemple #1

0

Afficher le fichier

Fichier : open_cam.py Projet : melissarib/workshop-deteccao-mascaras

import cv2 as cv
import functions
import os

cam = cv.VideoCapture(0)

file_name = "haarcascade_frontalface_alt2.xml"
classifier = face_cascade = cv.CascadeClassifier(cv.data.haarcascades + 'haarcascade_frontalface_default.xml')#Modelo para reconhecer faces


# Carregando dataframe com as imagens para treinamento
dataframe = functions.load_dataframe() 

# Dividindo conjuntos de treino e teste
X_train, X_test, y_train, y_test = functions.train_test(dataframe) 

# Modelo PCA para extração de features da imagem
pca = functions.pca_model(X_train) 

# Conjunto de treino com features extraídas
X_train = pca.transform(X_train) 

# Conjunto de teste com features extraídas
X_test = pca.transform(X_test) 

# Treinando modelo classificatório KNN
knn = functions.knn(X_train, y_train) 

# Rótulo das classificações
label = {
    0: "acho que nao...",

Exemple #2

0

Afficher le fichier

Fichier : create_trainset_ukdale.py Projet : qiyea/BitcnNILM

def main():

    start_time = time.time()
    sample_seconds = 6
    training_building_percent = 0
    validation_percent = 20
    testing_percent = 20
    nrows = None
    debug = True

    train = pd.DataFrame(columns=['aggregate', appliance_name])

    for h in params_appliance[appliance_name]['houses']:
        print('    ' + args.data_dir + 'house_' + str(h) + '/' + 'channel_' +
              str(params_appliance[appliance_name]['channels'][
                  params_appliance[appliance_name]['houses'].index(h)]) +
              '.dat')

        mains_df = load_dataframe(args.data_dir, h, 1)
        app_df = load_dataframe(
            args.data_dir,
            h,
            params_appliance[appliance_name]['channels'][
                params_appliance[appliance_name]['houses'].index(h)],
            col_names=['time', appliance_name])

        mains_df['time'] = pd.to_datetime(mains_df['time'], unit='s')
        mains_df.set_index('time', inplace=True)
        mains_df.columns = ['aggregate']
        #############################
        # mains_df.resample(str(sample_seconds) + 'S').mean()
        mains_df.reset_index(inplace=True)

        if debug:
            print("    mains_df:")
            print(mains_df.head())
            print(mains_df.tail())
            plt.plot(mains_df['time'], mains_df['aggregate'])
            plt.savefig('original-mains.png')
            plt.show()

        # Appliance
        ############

        app_df['time'] = pd.to_datetime(app_df['time'], unit='s')

        if debug:
            print("app_df:")
            print(app_df.head())
            print(app_df.tail())
            plt.plot(app_df['time'], app_df[appliance_name])
            plt.savefig('original-{}.png'.format(appliance_name))
            plt.show()

        # the timestamps of mains and appliance are not the same, we need to align them
        # 1. join the aggragte and appliance dataframes;
        # 2. interpolate the missing values;
        mains_df.set_index('time', inplace=True)
        app_df.set_index('time', inplace=True)
        ######add
        #app_df.resample(str(sample_seconds) + 'S').mean()


        df_align = mains_df.join(app_df, how='outer'). \
            resample(str(sample_seconds) + 'S').mean().fillna(method='backfill', limit=1)#fillna(method='backfill', limit=1)
        df_align = df_align.dropna()

        df_align.reset_index(inplace=True)

        if appliance_name == 'fridge':
            df_align[appliance_name] = df_align.apply(aggregate_app, axis=1)
            #df_align.to_csv('11111111_test_.csv', mode='a', index=False, header=False)

        del mains_df, app_df, df_align['time']

        if debug:
            # plot the dtaset
            print("df_align:")
            print(df_align.head())
            print(df_align.tail())
            # plt.plot(df_align['aggregate'].values)
            # plt.plot(df_align[appliance_name].values)
            # plt.savefig('{}.png'.format(appliance_name))
            # plt.show()
            test_len = int((len(df_align) / 100) * testing_percent)

            # fig1 = plt.figure()
            # ax1 = fig1.add_subplot(111)

            # ax1.plot(df_align['aggregate'][-test_len:-1], color='#7f7f7f', linewidth=1.8)
            # ax1.plot(df_align[appliance_name][-test_len:-1], color='#d62728', linewidth=1.6)

            plt.subplot(211)
            plt.title(appliance_name)
            plt.plot(df_align['aggregate'][-test_len:])
            plt.yticks(np.linspace(0, 5000, 5, endpoint=True))

            plt.subplot(212)
            plt.plot(df_align[appliance_name][-test_len:])
            plt.yticks(np.linspace(0, 5000, 5, endpoint=True))

            # plt.subplots_adjust(bottom=0.2, right=0.7, top=0.9, hspace=0.3)
            plt.savefig('{}-_subplot.png'.format(args.appliance_name))
            # # ax1.plot(prediction,
            # #          color='#1f77b4',
            # #          #marker='o',
            # #          linewidth=1.5)
            # # plt.xticks([])
            # ax1.grid()
            # # ax1.set_title('Test results on {:}'.format(test_filename), fontsize=16, fontweight='bold', y=1.08)
            # ax1.set_ylabel(appliance_name)
            # ax1.legend(['aggregate', appliance_name],loc='upper left')

            # mng = plt.get_current_fig_manager()
            # #mng.resize(*mng.window.maxsize())
            # plt.savefig('{}.png'.format(args.appliance_name))

        # Normilization ----------------------------------------------------------------------------------------------
        mean = params_appliance[appliance_name]['mean']
        std = params_appliance[appliance_name]['std']

        df_align['aggregate'] = (df_align['aggregate'] -
                                 args.aggregate_mean) / args.aggregate_std
        df_align[appliance_name] = (df_align[appliance_name] - mean) / std

        # if h == params_appliance[appliance_name]['test_build']:
        #     # Test CSV
        #     df_align.to_csv(args.save_path + appliance_name + '_test_.csv', mode='a', index=False, header=False)
        #     print("    Size of test set is {:.4f} M rows.".format(len(df_align) / 10 ** 6))
        #     continue

        train = train.append(df_align, ignore_index=True)
        del df_align

    # Crop dataset
    if training_building_percent is not 0:
        train.drop(
            train.index[-int((len(train) / 100) * training_building_percent):],
            inplace=True)

    test_len = int((len(train) / 100) * testing_percent)
    val_len = int((len(train) / 100) * validation_percent)

    #Testing CSV
    test = train.tail(test_len)

    test.reset_index(drop=True, inplace=True)
    train.drop(train.index[-test_len:], inplace=True)
    test.to_csv(args.save_path + appliance_name + '_test_.csv',
                mode='a',
                index=False,
                header=False)

    # Validation CSV
    val = train.tail(val_len)
    val.reset_index(drop=True, inplace=True)
    train.drop(train.index[-val_len:], inplace=True)
    # Validation CSV
    val.to_csv(args.save_path + appliance_name + '_validation_' + '.csv',
               mode='a',
               index=False,
               header=False)

    # Training CSV
    train.to_csv(args.save_path + appliance_name + '_training_.csv',
                 mode='a',
                 index=False,
                 header=False)

    print("    Size of total training set is {:.4f} M rows.".format(
        len(train) / 10**6))
    print("    Size of total validation set is {:.4f} M rows.".format(
        len(val) / 10**6))
    print("    Size of total testing set is {:.4f} M rows.".format(
        len(test) / 10**6))
    del train, val, test

    print("\nPlease find files in: " + args.save_path)
    print("Total elapsed time: {:.2f} min.".format(
        (time.time() - start_time) / 60))

Exemple #3

0

Afficher le fichier

Fichier : create_trainset_ukdale.py Projet : xc9707/transferNILM

def main():

    start_time = time.time()
    sample_seconds = 8
    training_building_percent = 95
    validation_percent = 13
    nrows = None
    debug = False

    train = pd.DataFrame(columns=['aggregate', appliance_name])

    for h in params_appliance[appliance_name]['houses']:
        print('    ' + args.data_dir + 'house_' + str(h) + '/'
              + 'channel_' +
              str(params_appliance[appliance_name]['channels'][params_appliance[appliance_name]['houses'].index(h)]) +
              '.dat')

        mains_df = load_dataframe(args.data_dir, h, 1)
        app_df = load_dataframe(args.data_dir,
                                h,
                                params_appliance[appliance_name]['channels'][params_appliance[appliance_name]['houses'].index(h)],
                                col_names=['time', appliance_name]
                                )

        mains_df['time'] = pd.to_datetime(mains_df['time'], unit='s')
        mains_df.set_index('time', inplace=True)
        mains_df.columns = ['aggregate']
        #resample = mains_df.resample(str(sample_seconds) + 'S').mean()
        mains_df.reset_index(inplace=True)

        if debug:
            print("    mains_df:")
            print(mains_df.head())
            plt.plot(mains_df['time'], mains_df['aggregate'])
            plt.show()

        # Appliance
        app_df['time'] = pd.to_datetime(app_df['time'], unit='s')

        if debug:
            print("app_df:")
            print(app_df.head())
            plt.plot(app_df['time'], app_df[appliance_name])
            plt.show()

        # the timestamps of mains and appliance are not the same, we need to align them
        # 1. join the aggragte and appliance dataframes;
        # 2. interpolate the missing values;
        mains_df.set_index('time', inplace=True)
        app_df.set_index('time', inplace=True)

        df_align = mains_df.join(app_df, how='outer'). \
            resample(str(sample_seconds) + 'S').mean().fillna(method='backfill', limit=1)
        df_align = df_align.dropna()

        df_align.reset_index(inplace=True)

        del mains_df, app_df, df_align['time']

        if debug:
            # plot the dtaset
            print("df_align:")
            print(df_align.head())
            plt.plot(df_align['aggregate'].values)
            plt.plot(df_align[appliance_name].values)
            plt.show()

        # Normilization ----------------------------------------------------------------------------------------------
        mean = params_appliance[appliance_name]['mean']
        std = params_appliance[appliance_name]['std']

        df_align['aggregate'] = (df_align['aggregate'] - args.aggregate_mean) / args.aggregate_std
        df_align[appliance_name] = (df_align[appliance_name] - mean) / std

        if h == params_appliance[appliance_name]['test_build']:
            # Test CSV
            df_align.to_csv(args.save_path + appliance_name + '_test_.csv', mode='a', index=False, header=False)
            print("    Size of test set is {:.4f} M rows.".format(len(df_align) / 10 ** 6))
            continue

        train = train.append(df_align, ignore_index=True)
        del df_align

    # Crop dataset
    if training_building_percent is not 0:
        train.drop(train.index[-int((len(train)/100)*training_building_percent):], inplace=True)


    # Validation CSV
    val_len = int((len(train)/100)*validation_percent)
    val = train.tail(val_len)
    val.reset_index(drop=True, inplace=True)
    train.drop(train.index[-val_len:], inplace=True)
    # Validation CSV
    val.to_csv(args.save_path + appliance_name + '_validation_' + '.csv', mode='a', index=False, header=False)

    # Training CSV
    train.to_csv(args.save_path + appliance_name + '_training_.csv', mode='a', index=False, header=False)

    print("    Size of total training set is {:.4f} M rows.".format(len(train) / 10 ** 6))
    print("    Size of total validation set is {:.4f} M rows.".format(len(val) / 10 ** 6))
    del train, val


    print("\nPlease find files in: " + args.save_path)
    print("Total elapsed time: {:.2f} min.".format((time.time() - start_time) / 60))

Exemple #4

0

Afficher le fichier

Fichier : open_cam.py Projet : pedrinhoas7/detector-de-mascaras

import cv2 as cv
import functions

cam = cv.VideoCapture(0)  #Iniciando a WebCam
file_name = "haarcascade_frontalface_alt2.xml"
classifier = cv.CascadeClassifier(
    f"{cv.haarcascades}/{file_name}")  #Modelo para reconhecer faces

dataframe = functions.load_dataframe(
)  #Carregando dataframe com as imagens para treinamento

X_train, X_test, y_train, y_test = functions.train_test(
    dataframe)  #Dividindo conjuntos de treino e teste
pca = functions.pca_model(
    X_train)  #Modelo PCA para extração de features da imagem

X_train = pca.transform(X_train)  #Conjunto de treino com features extraídas
X_test = pca.transform(X_test)  #Conjunto de teste com features extraídas

knn = functions.knn(X_train, y_train)  #Treinando modelo classificatório KNN

#Rótulo das classificações
label = {0: "Sem mascara", 1: "Com mascara"}

#Abrindo a webcam...
while True:
    status, frame = cam.read()  #Lendo a imagem e extraindo frame

    if not status:
        break