Python Config.dataset_file 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: aibolit.config

클래스/타입: Config

메소드/함수: dataset_file

hotexamples.com에서의 예제들: 2

Python Config.dataset_file - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 aibolit.config.Config.dataset_file에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

get_patterns_config(19)

folder_model_data(3)

dataset_file(2)

folder_to_save_model_data(1)

home_aibolit_folder(1)

test_csv(1)

train_csv(1)

예제 #1

파일 보기

 def make_patterns(args, cur_work_dir):
     print('Compute patterns...')
     result = subprocess.run(['make', 'patterns'], stdout=subprocess.PIPE, encoding='utf-8', cwd=cur_work_dir)
     print(result.returncode)
     if result.returncode != 0:
         print(result.stderr)
         exit(3)
     else:
         print(result.stdout)
         if args.dataset_file:
             dataset_file_path = Path(cur_work_dir, args.dataset_file)
             if not dataset_file_path.parent.exists():
                 dataset_file_path.parent.mkdir(parents=True)
             shutil.copy(Path(Config.dataset_file()), dataset_file_path)
         else:
             dataset_file_path = Path(Config.dataset_file())
         print('dataset was saved to {}'.format(str(dataset_file_path.absolute())))

예제 #2

파일 보기

    def preprocess_file(self, scale_ncss=True, scale=False, **kwargs):

        df = pd.read_csv(Config.dataset_file())
        df = df[~df["filename"].str.lower().str.contains("test")]
        config = Config.get_patterns_config()
        if self.do_rename_columns:
            p_codes = \
                [x['code'] for x in config['patterns']] \
                + ['lines' + x['code'] for x in config['patterns']]
            m_codes = [x['code'] for x in config['metrics']]
            keys = p_codes + m_codes
            vals = \
                [x['name'] for x in config['patterns']] \
                + ['lines' + x['name'] for x in config['patterns']] \
                + [x['name'] for x in config['metrics']]

            replace_dict = dict(zip(keys, vals))
            df = df.rename(replace_dict)
            df.columns = vals
            print('Columns renamed:' + df.head())

        df = df.dropna().drop_duplicates(
            subset=df.columns.difference(['filename']))
        df = df[(df.ncss > 20) & (df.ncss < 100) &
                (df.npath_method_avg < 100000.00)].copy().reset_index()

        df.drop('filename', axis=1, inplace=True)
        df.drop('index', axis=1, inplace=True)
        self.target = df[['M4']].values[:, 0]
        if scale_ncss:
            new = pd.DataFrame(df[self.only_patterns].values /
                               df['M2'].values.reshape((-1, 1)),
                               columns=self.only_patterns)
            self.target /= df['M2'].values.reshape(-1)
        else:
            new = df[self.only_patterns].copy()
        if scale:
            self.input = pd.DataFrame(StandardScaler().fit_transform(
                new.values),
                                      columns=new.columns,
                                      index=new.index).values
        else:
            self.input = new.values

        self.feature_order = list(new.columns)