Python DictItemSelectorの例

プログラミング言語: Python

名前空間/パッケージ名: apps.document.fields_detection.vectorizers

メソッド/関数: DictItemSelector

hotexamples.comのコード掲載数: 4

Python DictItemSelector - 4件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのapps.document.fields_detection.vectorizers.DictItemSelectorの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: field_types.py プロジェクト: viralsteroids/lexpredict-contraxsuite

    def build_vectorization_pipeline(
            self) -> Tuple[List[Tuple[str, Any]], Callable[[], List[str]]]:
        vect_cur = CountVectorizer(strip_accents='unicode',
                                   analyzer='word',
                                   stop_words='english',
                                   tokenizer=vectorizers.whole_value_as_token)
        vect_amount = vectorizers.NumberVectorizer()

        def get_feature_names_(vect_cur_, vect_amount_):
            def res():
                return ['currency_' + str(c) for c in vect_cur_.get_feature_names()] \
                       + ['amount_' + str(fn) for fn in vect_amount_.get_feature_names()]

            return res

        return [
            ('vect',
             FeatureUnion(transformer_list=[(
                 'currency',
                 Pipeline([
                     ('selector',
                      vectorizers.DictItemSelector(item='currency')),
                     ('clean', vectorizers.ReplaceNoneTransformer('')),
                     ('vect', vect_cur),
                     ('tfidf', TfidfTransformer()),
                 ])),
                                            ('amount',
                                             Pipeline([
                                                 ('selector',
                                                  vectorizers.DictItemSelector(
                                                      item='amount')),
                                                 ('vect', vect_amount),
                                             ]))]))
        ], get_feature_names_(vect_cur, vect_amount)

コード例 #2

ファイルを表示

 def build_vectorization_pipeline(self) -> Tuple[List[Tuple[str, Any]], Callable[[], List[str]]]:
     vect = CountVectorizer(strip_accents='unicode', analyzer='word',
                            stop_words='english')
     return [('item_select', vectorizers.DictItemSelector('address')),
             ('clean', vectorizers.ReplaceNoneTransformer('')),
             ('vect', vect),
             ('tfidf', TfidfTransformer())], self._wrap_get_feature_names(vect)

コード例 #3

ファイルを表示

 def build_vectorization_pipeline(self) -> List[Tuple[str, Any]]:
     return [
         ('vect', FeatureUnion(transformer_list=[
             ('currency', Pipeline([
                 ('selector', vectorizers.DictItemSelector(item='currency')),
                 ('clean', vectorizers.ReplaceNoneTransformer('')),
                 ('vect', CountVectorizer(strip_accents='unicode', analyzer='word',
                                          stop_words='english', tokenizer=vectorizers.whole_value_as_token)),
                 ('tfidf', TfidfTransformer()),
             ])),
             ('amount', Pipeline([
                 ('selector', vectorizers.DictItemSelector(item='amount')),
                 ('vect', vectorizers.NumberVectorizer()),
             ]))
         ]))
     ]

コード例 #4

ファイルを表示

 def build_vectorization_pipeline(self) -> List[Tuple[str, Any]]:
     return [('item_select', vectorizers.DictItemSelector('address')),
             ('clean', vectorizers.ReplaceNoneTransformer('')),
             ('vect', CountVectorizer(strip_accents='unicode', analyzer='word',
                                      stop_words='english')),
             ('tfidf', TfidfTransformer())]