def preprocess(dataset): if dataset == 'train': # train label 전처리 수행 (acc_id 정렬, one-hot-encoding) label.ohe() label.no_ohe() dfs = load_data(dataset, RAW_DIR) # raw csv 로드 df = merge_df(dataset, dfs) # 한개 csv로 merge df = fill_day(dataset, df) # 28 days 채우기 (오랜시간 소요) df = replace_nan(dataset, df) save_df(dataset, df, PREPROCESS_DIR) # 저장
def preprocess(dataset): dfs = load_data(dataset, raw_dir) # raw csv 로드 df = merge_df(dataset, dfs) # 한개 csv로 merge df = fill_day(dataset, df) # 28 days 채우기 (오랜시간 소요) df = replace_nan(dataset, df) save_df(dataset, df, preprocess_dir) # 저장