Python impute_with_constants示例

编程语言: Python

命名空间/包名称: impute

方法/功能: impute_with_constants

hotexamples.com的示例: 2

Python impute_with_constants - 已找到2个示例。这些是从开源项目中提取的最受好评的impute.impute_with_constants现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： drug_frame.py 项目： SnehalA/PennMedOnTap

def build_meds_frame(ta, frame_name, in_path, overwrite = True):

    print "*** CREATING DRUG HISTORY FRAME at " + frame_name
    if (frame_name in ta.get_frame_names()):
        if (not overwrite):
            return ta.get_frame(frame_name)
        else:
            ta.drop_frames([frame_name])

    add_udf_files(ta, [clean_drugs, derived_features, history_utilities, uphs_fields, uphs_schema])

    data_fields = [ PATID, VISID, ADM_DATE,  MED_ORDER_NAMEs, DISCHARGE_MED_ORDER_NAMEs ]
    data_frame = loader.load_frame(ta, in_path, frame_name, data_fields)

    print "Filtering out rows with missing or junk patient ids and/or visit ids"

    data_frame.filter(lambda row:  row[PATID] != None and row[VISID] != None and [PATID] != 'None' and row[VISID] != 'None')
    data_defaults = {MED_ORDER_NAMEs : "", DISCHARGE_MED_ORDER_NAMEs: ""}

    print "Imputing missing drug fields with empty lists"
    impute_with_constants(data_frame, data_defaults)


    data_frame.add_columns(lambda row: row[MED_ORDER_NAMEs] + ", " + row[DISCHARGE_MED_ORDER_NAMEs], (UNCLEAN_COMBINED_MEDLIST, str))
    data_frame.drop_columns([MED_ORDER_NAMEs, DISCHARGE_MED_ORDER_NAMEs])

    data_frame.add_columns(lambda row: drug_cleaner.to_clean_doc(row[UNCLEAN_COMBINED_MEDLIST], medlist_delimiter), (COMBINED_MEDLIST, str))
    data_frame.drop_columns([UNCLEAN_COMBINED_MEDLIST])

    return data_frame

示例#2

显示文件

文件： basic_features.py 项目： SnehalA/PennMedOnTap

def get_basic_features(ta, frame_name, in_path, overwrite = True):

    if (frame_name in ta.get_frame_names()):
        if (not overwrite):
            return ta.get_frame(frame_name)
        else:
            ta.drop_frames(frame_name)

    frame = loader.load_frame(ta, in_path, frame_name, data_columns)

    add_udf_files(ta, [uphs_fields, filters])

    frame.filter(lambda row: patid_filter(row) and visid_filter(row))

    impute_with_constants(frame, default_values)

    return frame