Python retrieve_meta 예제들, c0104_retrieve_meta.retrieve_meta Python 예제들

예제 #1

0

파일 보기

def format_source():
    """
    define each record
    set the beginning of the record
    set the end of the record
    record the length of the record
    """

    print("begin format_source")

    # timestamp and save the source measurements
    # no truncation
    # save as their recordName

    study_list = retrieve_ref('study_list')
    sensor_list = retrieve_ref('sensor_list')

    # check each study
    for study in study_list:

        df_meta = retrieve_meta(study)
        print(df_meta)

        recordNames = list(df_meta['recordName'])

        for record in recordNames:

            i = df_meta[df_meta['recordName'] == record].index.values[0]
            recordSource = df_meta.loc[i, 'source_path']
            recordBegin = df_meta.loc[i, 'recordBegin']
            recordEnd = df_meta.loc[i, 'recordEnd']

            print('i = ' + str(i))
            print('record = ' + str(record))
            print('recordSource = ' + str(recordSource))

            for sensor in sensor_list:

                format_type, segment = 'source', 'All'
                source = os.path.join('studies', study, format_type,
                                      recordSource, sensor + '.csv')
                df_source = pd.read_csv(source)

                df_timestamped = build_timestamps(df_source, sensor)

                # df_timestamped = df_timestamped[df_timestamped['timeUnix'] > recordBegin]
                # df_timestamped = df_timestamped[df_timestamped['timeUnix'] < recordEnd]

                path = [
                    'studies', study, 'formatted', format_type, record, segment
                ]
                path = build_path(path)
                file = os.path.join(path, sensor + ".csv")
                df_timestamped.to_csv(file)
                print('formatted source file = ' + str(file))

예제 #2

0

파일 보기

파일: c0111_find_record_begin.py 프로젝트: jesnyder/MeasuredStress

def find_record_end():
    """
    timestamp the source
    """

    print("begin timestamp source")

    study_list = retrieve_ref('study_list')
    format_types = retrieve_ref('format_types')
    segment_list = retrieve_ref('segment_list')
    sensor_list = retrieve_ref('sensor_list')

    # timestamp temp
    format_type = 'source'
    segment = 'All'
    sensor = 'TEMP'

    for study in study_list:

        print('study = ' + str(study))

        df_meta = retrieve_meta(study)
        source_path = list(df_meta['source_path'])

        df_meta['recordBegin'] = [None] * len(source_path)
        df_meta['recordEnd'] = [None] * len(source_path)
        df_meta['fullLength'] = [None] * len(source_path)

        # summarize what has been found so far
        record_to_summary(study, 'Records found', len(source_path))

        for record in source_path:
            # source = os.path.join(study, 'source', record, sensor + '.csv')
            df_timestamped = timestamp_source(study, format_type, segment, record, sensor)


            # Save the full length of the uneditted record
            i = df_meta[ df_meta['source_path']== record].index.values[0]
            recordSplit = record.split('_')
            df_meta.loc[i, 'recordBegin' ] = int(recordSplit[0])
            df_meta.loc[i, 'recordEnd' ] = int(recordSplit[0]) + 60*(max(df_timestamped['timeMinutes']))
            df_meta.loc[i, 'fullLength' ] = round(max(df_timestamped['timeMinutes']) , 4)


        save_meta(study, df_meta)


    find_temp_end()

    """

예제 #3

0

파일 보기

파일: c0118_segment_formatted.py 프로젝트: jesnyder/MeasuredStress

def segment_formatted(format_type):
    """
    for each record
    break the record into a PreStudy, Study, and PostStudy period
    save each segment as a separate .csv
    """

    print("begin segment_formatted")

    study_list = retrieve_ref('study_list')
    sensor_list = retrieve_ref('sensor_list')
    format_types = retrieve_ref('format_types')

    segment_list = retrieve_ref('segment_list')
    timePreStudy = retrieve_ref('timePreStudy')
    timePostStudy = retrieve_ref('timePostStudy')

    # check each study
    for study in study_list:

        df_meta = retrieve_meta(study)
        recordNames = list(df_meta['recordName'])

        for record in recordNames:

            i = df_meta[df_meta['recordName'] == record].index.values[0]
            print('i = ' + str(i))

            for sensor in sensor_list:

                for segment in segment_list:

                    format_type, segmentRef = 'clean', 'All'
                    source = os.path.join('studies', study, 'formatted',
                                          format_type, record, segmentRef,
                                          sensor + '.csv')
                    df = pd.read_csv(source)

                    df_segmented = segment_df(segment, df)

                    path = [
                        'studies', study, 'formatted', format_type, record,
                        segment
                    ]
                    path = build_path(path)
                    file = os.path.join(path, sensor + ".csv")
                    df_segmented.to_csv(file)
                    print('segmented clean file = ' + str(file))

예제 #4

0

파일 보기

파일: c0112_define_records.py 프로젝트: jesnyder/MeasuredStress

def define_record():
    """
    define the original start time, end time, and length
    record to the metadata
    remove any records shorter than the minimum lemgth requirements
    """

    study_list = retrieve_ref('study_list')
    min_record_time = retrieve_ref('min_record_time')
    max_record_time = retrieve_ref('max_record_time')

    # check each study
    for study in study_list:

        # retrieve the list of records from the metadata.csv file
        df_meta = retrieve_meta(study)
        source_path = list(df_meta['source_path'])

        df_meta['recordBegin'] = [None] * len(source_path)
        df_meta['recordEnd'] = [None] * len(source_path)
        df_meta['recordLength'] = [None] * len(source_path)

        # define the original length of the record
        # remove records that are too short
        for record in source_path:

            i = df_meta[df_meta['source_path'] == record].index.values[0]
            originalBegin = df_meta.loc[i, 'originalBegin']
            originalEnd = df_meta.loc[i, 'originalEnd']
            originalLength = df_meta.loc[i, 'originalLength']

            format_type, segment, sensor = 'source', 'All', 'TEMP'
            source = os.path.join('studies', study, 'formatted', format_type,
                                  record, segment, sensor + '.csv')
            df = pd.read_csv(source)

            timeEndUnix = find_record_end_using_temp(df)
            recordBegin = originalBegin
            recordEnd = timeEndUnix
            recordLength = (timeEndUnix - recordBegin) / 60

            df_meta.loc[i, 'recordBegin'] = recordBegin
            df_meta.loc[i, 'recordEnd'] = recordEnd
            df_meta.loc[i, 'recordLength'] = round(recordLength, 4)

        # save the metadata file
        save_meta(study, df_meta)

예제 #5

0

파일 보기

def format_truncate():
    """
    define each record
    set the beginning of the record
    set the end of the record
    record the length of the record
    """

    print("begin format_truncate")

    # timestamp and save the source measurements
    # no truncation
    # save as their recordName

    study_list = retrieve_ref('study_list')
    sensor_list = retrieve_ref('sensor_list')

    # check each study
    for study in study_list:

        df_meta = retrieve_meta(study)
        recordNames = list(df_meta['recordName'])

        for record in recordNames:

            i = df_meta[ df_meta['recordName']== record].index.values[0]
            recordBegin = df_meta.loc[i, 'recordBegin' ]
            recordEnd = df_meta.loc[i, 'recordEnd' ]
            print('i = ' + str(i))

            for sensor in sensor_list:

                format_type, segment = 'source', 'All'
                source = os.path.join('studies', study, 'formatted', format_type, record, segment, sensor + '.csv')
                df = pd.read_csv(source)

                df = df[df['timeUnix'] > recordBegin]
                df = df[df['timeUnix'] < recordEnd]

                assert len(list(df['timeUnix'])) > 0, 'during format truncate, dataframe empty'

                format_type, segment = 'truncate', 'All'
                path = ['studies', study, 'formatted', format_type, record, segment]
                path = build_path(path)
                file = os.path.join(path, sensor + ".csv")
                df.to_csv(file)
                print('formatted truncated file = ' + str(file))

예제 #6

0

파일 보기

파일: c0112_define_records.py 프로젝트: jesnyder/MeasuredStress

def define_original():
    """
    define the original start time, end time, and length
    record to the metadata
    remove any records shorter than the minimum lemgth requirements
    """

    study_list = retrieve_ref('study_list')
    min_record_time = retrieve_ref('min_record_time')

    # check each study
    for study in study_list:

        # retrieve the list of records from the metadata.csv file
        df_meta = retrieve_meta(study)
        source_path = list(df_meta['source_path'])

        # add the columns to define the original record
        df_meta['recordName'] = source_path
        df_meta['originalBegin'] = [None] * len(source_path)
        df_meta['originalEnd'] = [None] * len(source_path)
        df_meta['originalLength'] = [None] * len(source_path)

        # define the original length of the record
        # remove records that are too short
        for record in source_path:

            format_type, segment, sensor = 'source', 'All', 'TEMP'
            df_timestamped = timestamp_source(study, format_type, segment,
                                              record, sensor)

            originalBegin = int(min(list(df_timestamped['timeUnix'])))
            originalEnd = int(max(list(df_timestamped['timeUnix'])))
            originalLength = (originalEnd - originalBegin) / 60

            i = df_meta[df_meta['source_path'] == record].index.values[0]

            df_meta.loc[i, 'originalBegin'] = originalBegin
            df_meta.loc[i, 'originalEnd'] = originalEnd
            df_meta.loc[i, 'originalLength'] = round(originalLength, 4)

        # save the metadata file
        save_meta(study, df_meta)
        df_meta = df_meta.drop(
            df_meta[df_meta['originalLength'] < min_record_time].index)
        save_meta(study, df_meta)

예제 #7

0

파일 보기

def pair_records():
    """
    use the record begin time and wearable id to check all studies and records for pairs
    if found, find the latest common start time and earliest end times
    save as new columns in the metadata file
    """

    study_list = retrieve_ref('study_list')
    sensor_list = retrieve_ref('sensor_list')

    # check each study
    for study in study_list:

        df_meta = retrieve_meta(study)
        recordNames = list(df_meta['recordName'])

        # create column to list wearableName and coregister records
        df_meta = add_wearableName(df_meta)
        df_meta['coregisterRecords'] = recordNames

        # look for paired records using the unix time stamp for when the record begins
        for recordA in recordNames:

            i = df_meta[df_meta['recordName'] == recordA].index.values[0]
            recordBeginA = df_meta.loc[i, 'recordBegin']
            wearableA = df_meta.loc[i, 'wearableName']

            for recordB in recordNames:

                j = df_meta[df_meta['recordName'] == recordB].index.values[0]
                recordBeginB = df_meta.loc[j, 'recordBegin']
                wearableB = df_meta.loc[j, 'wearableName']

                if abs(recordBeginA - recordBeginB) < 300:

                    if recordA != recordB:

                        if wearableA != wearableB:

                            print('coregister record found for ' + recordA +
                                  ' + ' + recordB)
                            coregisterList = str(recordA + ' ' + recordB)
                            df_meta.loc[i,
                                        'coregisterRecords'] = coregisterList

        save_meta(study, df_meta)

예제 #8

0

파일 보기

파일: c0119_compile_formatted.py 프로젝트: jesnyder/MeasuredStress

def compile_formatted(format_type):
    """
    collapse the information stored as separate csv into a single csv
    to make the information easier to plot in javascript/html
    also to upload less files to github
    """

    print("begin compile_formatted")

    study_list = retrieve_ref('study_list')
    sensor_list = retrieve_ref('sensor_list')
    format_types = retrieve_ref('format_types')

    segment_list = retrieve_ref('segment_list')
    timePreStudy = retrieve_ref('timePreStudy')
    timePostStudy = retrieve_ref('timePostStudy')

    # check each study
    for study in study_list:

        df_meta = retrieve_meta(study)
        recordNames = list(df_meta['recordName'])

        for record in recordNames:

            i = df_meta[ df_meta['recordName']== record].index.values[0]
            print('i = ' + str(i))

            for sensor in sensor_list:

                for segment in segment_list:

                    format_type, segmentRef = 'clean', 'All'
                    source = os.path.join('studies', study, 'formatted', format_type, record, segmentRef, sensor + '.csv')
                    df = pd.read_csv(source)

                    df_segmented = segment_df(segment, df)

                    path = ['studies', study, 'formatted', format_type, record, segment]
                    path = build_path(path)
                    file = os.path.join(path, sensor + ".csv")
                    df_segmented.to_csv(file)
                    print('segmented clean file = ' + str(file))

예제 #9

0

파일 보기

def clean_save():
    """
    for each record
    break the record into a PreStudy, Study, and PostStudy period
    save each segment as a separate .csv
    """

    print("begin clean_save")

    study_list = retrieve_ref('study_list')
    sensor_list = retrieve_ref('sensor_list')
    segment_list = retrieve_ref('segment_list')

    # check each study
    for study in study_list:

        df_meta = retrieve_meta(study)
        recordNames = list(df_meta['recordName'])

        for record in recordNames:

            i = df_meta[ df_meta['recordName']== record].index.values[0]
            print('i = ' + str(i))

            for sensor in sensor_list:

                format_type, segment = 'coregister', 'All'
                source = os.path.join('studies', study, 'formatted', format_type, record, segment, sensor + '.csv')
                df = pd.read_csv(source)

                df = reset_minutes(segment, df)

                for colName in list(df.head()):
                    if 'Unnamed' in colName:
                        del df[colName]

                format_type = 'clean'
                path = ['studies', study, 'formatted', format_type, record, segment]
                path = build_path(path)
                file = os.path.join(path, sensor + ".csv")
                df.to_csv(file)
                print('formatted clean file = ' + str(file))

예제 #10

0

파일 보기

파일: c0112_define_records.py 프로젝트: jesnyder/MeasuredStress

def add_embedded_to_meta():
    """

    """

    study_list = retrieve_ref('study_list')
    min_record_time = float(retrieve_ref('min_record_time'))

    # check each study
    for study in study_list:

        # retrieve the list of records from the metadata.csv file
        df_meta = retrieve_meta(study)
        source_path = list(df_meta['source_path'])

        # define the original length of the record
        # remove records that are too short
        for record in source_path:

            print('record = ' + str(record))
            print('df_meta = ')
            print(df_meta)

            i = df_meta[df_meta['source_path'] == record].index.values[0]
            embeddedRecord = float(df_meta.loc[i, 'embeddedRecord'])

            if embeddedRecord > 0:

                format_type, segment, sensor = 'source', 'All', 'TEMP'
                source = os.path.join('studies', study, 'formatted',
                                      format_type, record, segment,
                                      sensor + '.csv')
                df = pd.read_csv(source)

                recordBegin = int(embeddedRecord)
                df = df[df['timeUnix'] > recordBegin]
                timeEndUnix = find_record_end_using_temp(df)
                recordLength = (timeEndUnix - recordBegin) / 60

                df_row = df_meta[df_meta['source_path'] == record]

                record_split = record.split('_')
                recordName = str(str(recordBegin) + '_' + str(record_split[1]))
                print('embedded recordName = ' + recordName)

                df_row.loc[i, 'recordName'] = recordName
                df_row.loc[i, 'recordBegin'] = int(embeddedRecord)
                df_row.loc[i, 'recordEnd'] = int(timeEndUnix)
                df_row.loc[i, 'recordLength'] = round(recordLength, 4)

                print('df_row = ')
                print(df_row)

                df_meta = df_meta.append(df_row)
                # print(df_meta)

                format_type, segment, sensor = 'source', 'All', 'TEMP'
                source = os.path.join('studies', study, format_type, record,
                                      sensor + '.csv')
                df_source = pd.read_csv(source)
                df_timestamped = build_timestamps(df_source, sensor)

                path = build_path([
                    'studies', study, 'formatted', format_type, recordName,
                    segment
                ])
                file = os.path.join(path, sensor + ".csv")
                df_timestamped.to_csv(file)
                print('formatted source file = ' + str(file))

        df_meta = df_meta.sort_values(by='recordName')
        save_meta(study, df_meta)

예제 #11

0

파일 보기

파일: c0112_define_records.py 프로젝트: jesnyder/MeasuredStress

def find_embedded_records():
    """
    check for long records
    look for second sudden increase in temperature
    define the record begin, end, and duration
    log in the metadata file
    """

    study_list = retrieve_ref('study_list')
    min_record_time = float(retrieve_ref('min_record_time'))

    # check each study
    for study in study_list:

        # retrieve the list of records from the metadata.csv file
        df_meta = retrieve_meta(study)
        source_path = list(df_meta['source_path'])

        df_meta['embeddedRecord'] = [0] * len(source_path)

        print('df_meta = ')
        print(df_meta)

        # define the original length of the record
        # remove records that are too short
        for record in source_path:

            print('record = ' + str(record))

            i = df_meta[df_meta['source_path'] == record].index.values[0]
            originalLength = float(df_meta.loc[i, 'originalLength'])
            recordLength = float(df_meta.loc[i, 'recordLength'])

            print('originalLength = ' + str(originalLength))
            print('recordLength = ' + str(recordLength))

            if recordLength + min_record_time < originalLength:

                format_type, segment, sensor = 'source', 'All', 'TEMP'
                source = os.path.join('studies', study, 'formatted',
                                      format_type, record, segment,
                                      sensor + '.csv')
                df = pd.read_csv(source)

                print('df = ')
                print(df)

                timeUnix = list(df['timeUnix'])
                timeMinutes = list(df['timeMinutes'])
                measurements = list(df['measurement'])

                for j in range(len(measurements) - 12):

                    if timeMinutes[j] > recordLength + 1:

                        if timeMinutes[j] + min_record_time < originalLength:

                            if measurements[j] + 2 < measurements[j + 12]:

                                if measurements[j] + 2 < measurements[j + 100]:

                                    if measurements[j] + 3 < measurements[j +
                                                                          200]:

                                        secondRecordBegin = int(timeUnix[j +
                                                                         12])
                                        print('secondRecordBegin = ' +
                                              str(secondRecordBegin))
                                        df_meta.loc[
                                            i,
                                            'embeddedRecord'] = secondRecordBegin

        save_meta(study, df_meta)

예제 #12

0

파일 보기

def define_pairedRecords():
    """

    """
    study_list = retrieve_ref('study_list')
    sensor_list = retrieve_ref('sensor_list')

    # check each study
    for study in study_list:

        df_meta = retrieve_meta(study)
        recordNames = list(df_meta['recordName'])
        df_meta['coregisterBegin'] = [0] * len(recordNames)
        df_meta['coregisterEnd'] = [0] * len(recordNames)

        # name the wearable used for each record
        for record in recordNames:

            i = df_meta[df_meta['recordName'] == record].index.values[0]
            coregisterRecords = df_meta.loc[i, 'coregisterRecords']

            if len(coregisterRecords) > len(record):
                coregisterRecords = coregisterRecords.split(' ')
                print('coregisterRecords = ')
                print(coregisterRecords)

                print('coregisterRecords[0] = ')
                print(coregisterRecords[0])

            else:
                coregisterRecords = list([coregisterRecords])

            for item in coregisterRecords:

                print('coregisterRecords = ')
                print(coregisterRecords)
                print('item = ' + item)

                format_type, segment, sensor, recordRef = 'truncate', 'All', 'TEMP', item
                source = os.path.join('studies', study, 'formatted',
                                      format_type, recordRef, segment,
                                      sensor + '.csv')
                df_source = pd.read_csv(source)

                unixMin = int(min(list(df_source['timeUnix'])) + 12)
                unixMax = int(max(list(df_source['timeUnix'])) - 12)

                if df_meta.loc[i, 'coregisterBegin'] < unixMin or df_meta.loc[
                        i, 'coregisterBegin'] == 0:
                    df_meta.loc[i, 'coregisterBegin'] = unixMin

                if df_meta.loc[i, 'coregisterEnd'] > unixMax or df_meta.loc[
                        i, 'coregisterEnd'] == 0:
                    df_meta.loc[i, 'coregisterEnd'] = unixMax

        # sort meta file by record begin and drop duplicates
        df_meta = df_meta.sort_values(by='wearableName')
        df_meta = df_meta.drop_duplicates('coregisterRecords', keep='first')
        df_meta = df_meta.drop_duplicates('coregisterBegin', keep='first')
        df_meta = df_meta.sort_values(by='recordBegin')
        save_meta(study, df_meta)

예제 #13

0

파일 보기

def format_coregister():
    """
    combine paired record in a single csv
    save in the coregister folder of formatted data
    """

    study_list = retrieve_ref('study_list')
    sensor_list = retrieve_ref('sensor_list')

    for study in study_list:

        df_meta = retrieve_meta(study)
        recordNames = list(df_meta['recordName'])

        # name the wearable used for each record
        for record in recordNames:

            i = df_meta[df_meta['recordName'] == record].index.values[0]
            print('i = ' + str(i))
            coregisterBegin = df_meta.loc[i, 'coregisterBegin']
            coregisterEnd = df_meta.loc[i, 'coregisterEnd']
            coregisterRecords = df_meta.loc[i, 'coregisterRecords']

            for sensor in sensor_list:

                df_coregister = pd.DataFrame()

                if len(coregisterRecords) == len(record):
                    coregisterRecords = list([coregisterRecords])

                elif len(coregisterRecords) > len(record):
                    coregisterRecords = coregisterRecords.split(' ')

                print('coregisterRecords = ')
                print(coregisterRecords)

                for item in coregisterRecords:

                    format_type, segment, recordRef = 'truncate', 'All', item
                    source = os.path.join('studies', study, 'formatted',
                                          format_type, recordRef, segment,
                                          sensor + '.csv')
                    df = pd.read_csv(source)

                    assert coregisterEnd > coregisterBegin + 100, 'during coregister format, coregisterBegin >= coregisterEnd'
                    assert coregisterEnd < max(list(
                        df['timeUnix'])), 'possible error with time'

                    print('coregisterEnd = ' + str(coregisterEnd) +
                          ' timeUnixEnd = ' + str(max(list(df['timeUnix']))))
                    print('timeUnixEnd - coregisterEnd = ' +
                          str((max(list(df['timeUnix'])) - coregisterEnd) /
                              60))
                    print('coregisterEnd - timeUnixBegin = ' +
                          str((coregisterEnd - min(list(df['timeUnix']))) /
                              60))

                    assert coregisterEnd > min(list(df['timeUnix']))

                    df = df[df['timeUnix'] > coregisterBegin]
                    df = df[df['timeUnix'] < coregisterEnd]

                    assert len(list(
                        df['timeUnix'])) > 0, 'coregistered df removed'

                    recordSplit = item.split('_')
                    wearableName = recordSplit[1]

                    df_coregister['timeUnix'] = list(df['timeUnix'])
                    df_coregister['timeMinutes'] = list(df['timeMinutes'])

                    colName = str(wearableName + '_' + 'measurement')
                    print('colName = ' + colName)
                    df_coregister[colName] = list(df['measurement'])

                path = [
                    'studies', study, 'formatted', 'coregister', record,
                    segment
                ]
                path = build_path(path)
                file = os.path.join(path, sensor + ".csv")
                df_coregister.to_csv(file)
                print('formatted coregister file = ' + str(file))

예제 #14

0

파일 보기

파일: c0300_analyze_records.py 프로젝트: jesnyder/MeasuredStress

def analyze_mean():
    """
    analyze records
    """

    print("begin statistical analysis of records")

    study_list = retrieve_ref('study_list')
    sensor_list = retrieve_ref('sensor_list')
    segment_list = retrieve_ref('segment_list')

    for study in study_list:

        df_meta = retrieve_meta(study)



        format_type = 'clean'
        clean_path = os.path.join('studies', study, 'formatted', format_type)
        recordNames = os.listdir(clean_path)

        for sensor in sensor_list:

            for segment in segment_list:

                df_mean = pd.DataFrame()
                df_mean['recordName'] = recordNames

                i = df_meta[ df_meta['recordName']== recordNames[0]].index.values[0]
                coregisterRecords = df_meta.loc[i, 'coregisterRecords' ]

                if len(coregisterRecords) > 2*len(recordNames[0]):
                    colNameSplit = colName.split('_')
                    wearableName = colNameSplit[0]
                    newColName = str(wearableName + '_mean')
                    meanColName = newColName
                    df_mean[newColName] = [None] * len(recordNames)

                    recordRef = recordNames[0]
                    source = os.path.join('studies', study, 'formatted', format_type, recordRef, segment, sensor + '.csv')
                    df = pd.read_csv(source)

                    colNames = list(df.head())
                    for colName in colNames:
                        if str('meas') in str(colName):
                            colNameSplit = colName.split('_')
                            wearableName = colNameSplit[0]
                            newColName = str(wearableName + '_mean')
                            df_mean[newColName] = [None] * len(recordNames)
                            meanColName = newColName

                else:
                    newColName = 'mean'
                    df_mean[newColName] = [None] * len(recordNames)



                for record in recordNames:

                    i = df_meta[ df_meta['recordName']== record].index.values[0]
                    coregisterRecords = df_meta.loc[i, 'coregisterRecords' ]

                    source = os.path.join('studies', study, 'formatted', format_type, record, segment, sensor + '.csv')
                    print('source = ' + str(source))
                    df = pd.read_csv(source)

                    colNames = list(df.head())

                    for colName in colNames:

                        if str('measurement') in str(colName):

                            measurement = list(df[colName])
                            avg = np.mean(measurement)

                            # print('measurement = ')
                            # print(measurement)

                            if len(coregisterRecords) > 2*len(record):
                                colNameSplit = colName.split('_')
                                wearableName = colNameSplit[0]
                                newColName = str(wearableName + '_mean')
                                meanColName = newColName

                            else:
                                newColName = 'mean'

                            j = df_mean[ df_mean['recordName']== record].index.values[0]
                            df_mean.loc[j, newColName ] = round(avg, 4)
                            print('j = ' + str(j) + ' mean = ' + str(avg))


                path = ['studies', study, 'analyzed', 'statistics', 'mean', segment]
                path = build_path(path)
                file = os.path.join(path, sensor + ".csv")
                df_mean.to_csv(file)
                print('mean file saved: ' + file)


        print("completed statistical analysis of records")

예제 #15

0

파일 보기

def find_temp_end():
    """
    plot the timestamped data for the temperature
    """

    print("begin find temp end")

    study_list = retrieve_ref('study_list')
    sensor_list = retrieve_ref('sensor_list')
    max_record_time = float(retrieve_ref('max_record_time'))
    min_record_time = float(retrieve_ref('min_record_time'))
    trimBegin = float(retrieve_ref('trimBegin'))

    sensor = 'TEMP'
    segment = 'All'
    format_type = 'source'

    for study in study_list:

        df_meta = retrieve_meta(study)
        source_path = list(df_meta['source_path'])
        recordLength = list(df_meta['recordLength'])

        df_meta['recordEnd'] = [None] * len(source_path)
        df_meta['truncatedLength'] = [None] * len(source_path)

        for record in source_path:

            index = source_path.index(record)
            length = recordLength[index]

            df_timestamped = retrieve_analyzed(study, format_type, record,
                                               segment, sensor)
            df_timestamped = df_timestamped.drop(df_timestamped[
                df_timestamped['timeMinutes'] > max_record_time].index)

            timeUnix = df_timestamped['timeUnix']
            timeMinutes = df_timestamped['timeMinutes']
            measurements = df_timestamped['measurement']

            time_end = find_record_end_from_temp(df_timestamped)

            df_timestamped = df_timestamped.drop(
                df_timestamped[df_timestamped['timeMinutes'] > time_end].index)
            # df_timestamped = df_timestamped.drop(df_timestamped[df_timestamped['timeMinutes'] < trimBegin].index)

            path = os.path.join(study, 'formatted', 'truncate')
            if not os.path.isdir(path): os.mkdir(path)
            path = os.path.join(study, 'formatted', 'truncate')
            if not os.path.isdir(path): os.mkdir(path)
            path = os.path.join(study, 'formatted', 'truncate', record)
            if not os.path.isdir(path): os.mkdir(path)
            path = os.path.join(study, 'formatted', 'truncate', record, 'All')
            if not os.path.isdir(path): os.mkdir(path)
            path = os.path.join(study, 'formatted', 'truncate', record,
                                sensor + ".csv")
            df_timestamped.to_csv(path)

            truncatedLength = (max(df_timestamped['timeMinutes']))

            i = df_meta[df_meta['source_path'] == record].index.values[0]
            df_meta.loc[i, 'truncatedLength'] = round(truncatedLength, 4)
            df_meta.loc[i, 'recordEnd'] = timeUnix[0]

        save_meta(study, df_meta)