Esempi in Python per TfidfVectorizer

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: lale.lib.sklearn

Classe/tipologia: TfidfVectorizer

Esempi su hotexamples.com: 6

TfidfVectorizer in Python: 6 esempi trovati. Questi sono i migliori esempi reali in Python per lale.lib.sklearn.TfidfVectorizer, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

TfidfVectorizer(4)

validate_schema(2)

Metodi utilizzati di frequente

TfidfVectorizer (4)

validate_schema (2)

Esempio n. 1

Mostra file

File: test_type_checking.py Progetto: MSaber9/lale

 def test_tfidf_with_all_datasets(self):
     should_succeed = ["movies"]
     should_fail = ["irisArr", "irisDf", "digits", "housing", "creditG", "drugRev"]
     for name in should_succeed:
         dataset = getattr(self, f"_{name}")
         TfidfVectorizer.validate_schema(**dataset)
     for name in should_fail:
         dataset = getattr(self, f"_{name}")
         with self.assertRaises(ValueError):
             TfidfVectorizer.validate_schema(**dataset)

Esempio n. 2

Mostra file

File: test_core_operators.py Progetto: krprls/lale

 def test_more_hyperparam_values(self):
     with self.assertRaises(jsonschema.ValidationError):
         tf_idf = TfidfVectorizer(max_df=2.5, min_df=2,
                                 max_features=1000,
                                 stop_words='english')
     with self.assertRaises(jsonschema.ValidationError):
         tf_idf = TfidfVectorizer(max_df=2, min_df=2,
                                 max_features=1000,
                                 stop_words=['I', 'we', 'not', 'this', 'that'],
                                 analyzer = 'char')

Esempio n. 3

Mostra file

 def test_tfidf_with_all_datasets(self):
     should_succeed = ['movies']
     should_fail = ['irisArr', 'irisDf', 'digits', 'housing', 'creditG', 'drugRev']
     for name in should_succeed:
         dataset = getattr(self, f'_{name}')
         TfidfVectorizer.validate_schema(**dataset)
     for name in should_fail:
         dataset = getattr(self, f'_{name}')
         with self.assertRaises(ValueError):
             TfidfVectorizer.validate_schema(**dataset)

Esempio n. 4

Mostra file

File: test_core_transformers.py Progetto: tdoublep/lale

 def test_more_hyperparam_values(self):
     with EnableSchemaValidation():
         with self.assertRaises(jsonschema.ValidationError):
             _ = TfidfVectorizer(
                 max_df=2.5, min_df=2, max_features=1000, stop_words="english"
             )
         with self.assertRaises(jsonschema.ValidationError):
             _ = TfidfVectorizer(
                 max_df=2,
                 min_df=2,
                 max_features=1000,
                 stop_words=["I", "we", "not", "this", "that"],
                 analyzer="char",
             )

Esempio n. 5

Mostra file

File: test_core_operators.py Progetto: krprls/lale

 def test_non_null_tokenizer(self):
     # tokenize the doc and lemmatize its tokens
     def my_tokenizer():
         return 'abc'
     with self.assertRaises(jsonschema.ValidationError):
         tf_idf = TfidfVectorizer(max_df=2, min_df=2,
                                 max_features=1000,
                                 stop_words='english',
                                 tokenizer = my_tokenizer,
                                 analyzer = 'char')

Esempio n. 6

Mostra file

File: test_core_transformers.py Progetto: tanmaygaikwad/lale

    def test_non_null_tokenizer(self):
        # tokenize the doc and lemmatize its tokens
        def my_tokenizer():
            return "abc"

        with EnableSchemaValidation():
            with self.assertRaises(jsonschema.ValidationError):
                _ = TfidfVectorizer(
                    max_df=2,
                    min_df=2,
                    max_features=1000,
                    stop_words="english",
                    tokenizer=my_tokenizer,
                    analyzer="char",
                )