Python PreProcessor.get_dataset 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: preprocessing

클래스/타입: PreProcessor

메소드/함수: get_dataset

hotexamples.com에서의 예제들: 3

Python PreProcessor.get_dataset - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 preprocessing.PreProcessor.get_dataset에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

PreProcessor(18)

get_dataset(3)

run(2)

_cleaning(1)

agg_partitions(1)

config(1)

extract_video_face(1)

fit_transform(1)

get_data(1)

partition_image(1)

prepare_fold(1)

remove_nans(1)

save_transformers(1)

start(1)

str_to_float(1)

예제 #1

파일 보기

파일: test_preprocessing.py 프로젝트: ababa831/sagemaker_mlops_demo

    def test_推論時にget_datasetで辞書型にXが想定サンプル分ndarrayがあればTrue(self, do):
        from preprocessing import PreProcessor
        pp = PreProcessor(do.valid_config_path, mode='pred')
        dummy_df = do.dummy_valid_df
        dataset = pp.get_dataset(dummy_df)

        print('\n', dataset)

        errmsg = '特徴量Xのサンプル数が入力データのサンプル数と一致しない'
        assert dataset['X'].shape[0] == dummy_df.values.shape[0], errmsg

예제 #2

파일 보기

    def do_inference(cls, request_body):
        """与えられたdictを取り出して，
        apps内の各種MLパイプランに乗せて，最終推論結果を返す
        
        Parameters
        ----------
        request_body : dict
            リクエストbody
        
        Returns
        -------
        dict
            レスポンスbody
        """
        label = 'Survived'

        from utils import Utils
        logger = Utils.init_logger('predicton_sample')

        logger.info('前処理・特徴量エンジニアリング')
        from preprocessing import PreProcessor
        pred_df = pd.DataFrame(request_body)
        pp = PreProcessor(config_path=cls.config_path,
                          mode='pred',
                          label=label)
        pred_dataset = pp.get_dataset(pred_df)

        logger.info('推論')
        cls.load_models()
        from model import Model
        m = Model(config_path=cls.config_path, mode='pred')
        result = m.predict(pred_dataset)

        response_body = {label: result['y']}

        return response_body

예제 #3

파일 보기

파일: trainer.py 프로젝트: ababa831/sagemaker_mlops_demo

    config_path = cm.dst_path
    s3_dst_info = {
        's3_config': {
            'aws_profile': args.profile,
            'bucket_name': args.output_s3bucket,
            'path_s3_dst': child_dir
        }
    }
    cm.add_info(config_path, s3_dst_info)

    logger.info('学習データのロード')
    train_df = load_train_data(args.input_path)

    logger.info('前処理・特徴量エンジニアリング')
    pp = PreProcessor(config_path=config_path, mode='train', label='Survived')
    train_dataset = pp.get_dataset(train_df)
    pp.save_transformers(child_dir=child_dir,
                         transformers_name='sample_transformers.pkl.cmp')

    logger.info('学習')
    m = Model(config_path=config_path, mode='train')
    m.init_model()
    m.train_with_cv(train_dataset)
    m.save_model(dst_dir=model_dir,
                 child_dir=child_dir,
                 model_name='sample_model.pkl.cmp')

    logger.info('推論時に利用する各種ファイルをS3にUpload')
    # S3のUpload対象にconfigと学習データも含めたいとき，以下の処理を行う
    # 1. configと学習データの情報を更新
    newinfo = {