Python Stepの例、steps.base.Step Pythonの例

コード例 #1

0

ファイルを表示

ファイル: pipelines.py プロジェクト: spMohanty/open-solution-mapping-challenge

def unet(config, train_mode):
    if train_mode:
        save_output = False
        load_saved_output = False
    else:
        save_output = False
        load_saved_output = False

    loader = preprocessing(config, model_type='single', is_train=train_mode)
    unet = Step(name='unet',
                transformer=PyTorchUNet(**config.unet),
                input_steps=[loader],
                cache_dirpath=config.env.cache_dirpath,
                save_output=save_output,
                load_saved_output=load_saved_output)

    mask_postprocessed = mask_postprocessing(unet,
                                             config,
                                             save_output=save_output)
    detached = multiclass_object_labeler(mask_postprocessed,
                                         config,
                                         save_output=save_output)
    output = Step(name='output',
                  transformer=Dummy(),
                  input_steps=[detached],
                  adapter={
                      'y_pred': ([(detached.name, 'labeled_images')]),
                  },
                  cache_dirpath=config.env.cache_dirpath,
                  save_output=save_output,
                  load_saved_output=False)
    return output

コード例 #2

0

ファイルを表示

def watershed_contours(mask, contour, config, save_output=True):
    watershed_contour = Step(name='watershed_contour',
                             transformer=WatershedContour(),
                             input_steps=[mask, contour],
                             adapter={
                                 'images': ([(mask.name, 'binarized_images')]),
                                 'contours':
                                 ([(contour.name, 'binarized_images')]),
                             },
                             cache_dirpath=config.env.cache_dirpath,
                             save_output=save_output)

    drop_smaller = Step(name='drop_smaller',
                        transformer=Dropper(**config.dropper),
                        input_steps=[watershed_contour],
                        adapter={
                            'labels':
                            ([('watershed_contour', 'detached_images')]),
                        },
                        cache_dirpath=config.env.cache_dirpath,
                        save_output=save_output)
    return drop_smaller

    binary_fill = Step(name='binary_fill',
                       transformer=BinaryFillHoles(),
                       input_steps=[drop_smaller],
                       adapter={
                           'images': ([('drop_smaller', 'labels')]),
                       },
                       cache_dirpath=config.env.cache_dirpath,
                       save_output=save_output)

    return binary_fill

コード例 #3

0

ファイルを表示

def _normalize(features, config, train_mode, **kwargs):
    if train_mode:
        feature_train, features_valid = features
        normalizer = Step(name='normalizer',
                          transformer=Normalizer(),
                          input_steps=[feature_train],
                          adapter={
                              'X': ([(feature_train.name, 'features')]),
                          },
                          cache_dirpath=config.env.cache_dirpath,
                          **kwargs)

        normalizer_valid = Step(name='normalizer_valid',
                                transformer=normalizer,
                                input_steps=[features_valid],
                                adapter={
                                    'X': ([(features_valid.name, 'features')]),
                                },
                                cache_dirpath=config.env.cache_dirpath,
                                **kwargs)

        return normalizer, normalizer_valid

    else:
        normalizer = Step(name='normalizer',
                          transformer=Normalizer(),
                          input_steps=[features],
                          adapter={
                              'X': ([(features.name, 'features')]),
                          },
                          cache_dirpath=config.env.cache_dirpath,
                          **kwargs)

        return normalizer

コード例 #4

0

ファイルを表示

def tfidf_logreg(config):
    preprocessed_input = _preprocessing(config, is_train=False)
    tfidf_char_vectorizer, tfidf_word_vectorizer = _tfidf(
        preprocessed_input, config)

    tfidf_logreg = Step(name='tfidf_logreg',
                        transformer=LogisticRegressionMultilabel(
                            **config.logistic_regression_multilabel),
                        input_steps=[
                            preprocessed_input, tfidf_char_vectorizer,
                            tfidf_word_vectorizer
                        ],
                        adapter={
                            'X': ([('tfidf_char_vectorizer', 'features'),
                                   ('tfidf_word_vectorizer', 'features')],
                                  sparse_hstack_inputs),
                            'y': ([('cleaning_output', 'y')]),
                        },
                        cache_dirpath=config.env.cache_dirpath)
    output = Step(name='tfidf_logreg_output',
                  transformer=Dummy(),
                  input_steps=[tfidf_logreg],
                  adapter={
                      'y_pred': ([('tfidf_logreg', 'prediction_probability')]),
                  },
                  cache_dirpath=config.env.cache_dirpath)
    return output

コード例 #5

0

ファイルを表示

def bad_word_count_features_logreg(config):
    preprocessed_input = _preprocessing(config, is_train=False)
    normalizer = _count_features(config)
    xy_split = normalizer.get_step('xy_split')
    tfidf_word_vectorizer = _bad_word_tfidf(preprocessed_input, config)

    bad_word_count_logreg = Step(
        name='bad_word_count_logreg',
        transformer=LogisticRegressionMultilabel(
            **config.logistic_regression_multilabel),
        input_steps=[xy_split, normalizer, tfidf_word_vectorizer],
        adapter={
            'X': ([('normalizer', 'X'),
                   ('bad_word_tfidf_word_vectorizer', 'features')],
                  sparse_hstack_inputs),
            'y': ([('xy_split', 'y')]),
        },
        cache_dirpath=config.env.cache_dirpath)

    output = Step(name='bad_word_count_features_logreg_output',
                  transformer=Dummy(),
                  input_steps=[bad_word_count_logreg],
                  adapter={
                      'y_pred':
                      ([('bad_word_count_logreg', 'prediction_probability')]),
                  },
                  cache_dirpath=config.env.cache_dirpath)
    return output

コード例 #6

0

ファイルを表示

def unet(config, train_mode):
    if train_mode:
        save_output = False
        load_saved_output = False
    else:
        save_output = False
        load_saved_output = False

    loader = preprocessing(config, model_type='single', is_train=train_mode)
    unet = Step(name='unet',
                transformer=PyTorchUNetStream(**config.unet) if config.execution.stream_mode else PyTorchUNet(
                    **config.unet),
                input_steps=[loader],
                cache_dirpath=config.env.cache_dirpath,
                save_output=save_output, load_saved_output=load_saved_output)

    mask_postprocessed = mask_postprocessing(loader, unet, config, save_output=save_output)

    output = Step(name='output',
                  transformer=Dummy(),
                  input_steps=[mask_postprocessed],
                  adapter={'y_pred': ([(mask_postprocessed.name, 'images')]),
                           'y_scores': ([(mask_postprocessed.name, 'scores')])
                           },
                  cache_dirpath=config.env.cache_dirpath,
                  save_output=save_output,
                  load_saved_output=False)
    return output

コード例 #7

0

ファイルを表示

ファイル: pipelines.py プロジェクト: yatsenkotetyana/kaggle-toxic-starter

def inference_preprocessing(config):
    xy_train = Step(name='xy_train',
                    transformer=XYSplit(**config.xy_splitter),
                    input_data=['input'],
                    adapter={'meta': ([('input', 'meta')]),
                             'train_mode': ([('input', 'train_mode')])
                             },
                    cache_dirpath=config.env.cache_dirpath)

    text_cleaner = Step(name='text_cleaner_train',
                        transformer=TextCleaner(**config.text_cleaner),
                        input_steps=[xy_train],
                        adapter={'X': ([('xy_train', 'X')])},
                        cache_dirpath=config.env.cache_dirpath)

    cleaning_output = Step(name='cleaning_output',
                           transformer=Dummy(),
                           input_data=['input'],
                           input_steps=[xy_train, text_cleaner],
                           adapter={'X': ([('text_cleaner_train', 'X')]),
                                    'y': ([('xy_train', 'y')]),
                                    'train_mode': ([('input', 'train_mode')]),
                                    },
                           cache_dirpath=config.env.cache_dirpath)
    return cleaning_output

コード例 #8

0

ファイルを表示

ファイル: pipelines.py プロジェクト: dem-esgal/kaggle-toxic-starter

def glove_lstm_train(config):
    preprocessed_input = train_preprocessing(config)
    word_tokenizer, glove_embeddings = glove_preprocessing_train(
        config, preprocessed_input)
    glove_lstm = Step(
        name='glove_lstm',
        transformer=GloveLSTM(**config.glove_lstm_network),
        overwrite_transformer=True,
        input_steps=[word_tokenizer, preprocessed_input, glove_embeddings],
        adapter={
            'X': ([('word_tokenizer', 'X')]),
            'y': ([('xy_split', 'y')]),
            'embedding_matrix': ([('glove_embeddings', 'embeddings_matrix')]),
            'validation_data': ([('word_tokenizer', 'X_valid'),
                                 ('xy_split', 'validation_data')], join_valid),
        },
        cache_dirpath=config.env.cache_dirpath)
    glove_output = Step(name='output_glove',
                        transformer=Dummy(),
                        input_steps=[glove_lstm],
                        adapter={
                            'y_pred':
                            ([('glove_lstm', 'prediction_probability')]),
                        },
                        cache_dirpath=config.env.cache_dirpath)
    return glove_output

コード例 #9

0

ファイルを表示

ファイル: pipelines.py プロジェクト: dem-esgal/kaggle-toxic-starter

def char_vdcnn_train(config):
    preprocessed_input = train_preprocessing(config)
    char_tokenizer = Step(name='char_tokenizer',
                          transformer=Tokenizer(**config.char_tokenizer),
                          input_steps=[preprocessed_input],
                          adapter={
                              'X': ([('xy_split', 'X')], fetch_x_train),
                              'X_valid': ([('xy_split', 'validation_data')],
                                          fetch_x_valid),
                              'train_mode': ([('xy_split', 'train_mode')])
                          },
                          cache_dirpath=config.env.cache_dirpath)
    network = Step(name='char_vdcnn',
                   transformer=CharVDCNN(**config.char_vdcnn_network),
                   overwrite_transformer=True,
                   input_steps=[char_tokenizer, preprocessed_input],
                   adapter={
                       'X': ([('char_tokenizer', 'X')]),
                       'y': ([('xy_split', 'y')]),
                       'validation_data':
                       ([('char_tokenizer', 'X_valid'),
                         ('xy_split', 'validation_data')], join_valid),
                   },
                   cache_dirpath=config.env.cache_dirpath)
    char_output = Step(name='char_output',
                       transformer=Dummy(),
                       input_steps=[network],
                       adapter={
                           'y_pred':
                           ([('char_vdcnn', 'prediction_probability')]),
                       },
                       cache_dirpath=config.env.cache_dirpath)
    return char_output

コード例 #10

0

ファイルを表示