Python Featurizerの例

プログラミング言語: Python

名前空間/パッケージ名: featurize

メソッド/関数: Featurizer

hotexamples.comのコード掲載数: 7

Python Featurizer - 7件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのfeaturize.Featurizerの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

 def test_regex_extract_not_enough_input2(self):
     w = featurize.WebCorpusExtractor(regex_filter=[
         r'<CAS<([^<>]+)>',
     ])
     f = featurize.Featurizer(6, 11, label_extractor=w)
     f.featurize_stream(io.StringIO(input_with_cases))
     self.assertFalse(f.dataset.full)

コード例 #2

ファイルを表示

 def test_regex_extract(self):
     w = featurize.WebCorpusExtractor(regex_filter=[
         r'<CAS<([^<>]+)>',
     ])
     f = featurize.Featurizer(2, 20, label_extractor=w)
     f.featurize_stream(io.StringIO(input_with_cases))
     self.assertEqual(len(f.dataset), 4)

コード例 #3

ファイルを表示

 def test_keep_duplicates(self):
     s = len(input_with_duplicates.split('\n'))
     f = featurize.Featurizer(30, 300, skip_duplicates=False)
     f.featurize_stream(io.StringIO(input_with_duplicates))
     self.assertEqual(len(f.dataset), s)

コード例 #4

ファイルを表示

 def test_empty_extractor2(self):
     f = featurize.Featurizer(3)
     f.featurize_stream(io.StringIO(input_with_cases))
     self.assertIn('részletez/VERB<INF>', f.dataset.labels)

コード例 #5

ファイルを表示

 def test_empty_extractor(self):
     s = len(input_with_cases.strip().split('\n'))
     f = featurize.Featurizer(3)
     f.featurize_stream(io.StringIO(input_with_cases))
     self.assertEqual(len(f.dataset), s)

コード例 #6

ファイルを表示

 def test_pos_extract_not_enough_input(self):
     w = featurize.WebCorpusExtractor(grep_filter=["NOUN", "VERB"])
     f = featurize.Featurizer(200, 20, label_extractor=w)
     f.featurize_stream(io.StringIO(input_simple))
     self.assertFalse(f.dataset.full)

コード例 #7

ファイルを表示

 def test_pos_extract(self):
     w = featurize.WebCorpusExtractor(grep_filter=["NOUN", "VERB"])
     f = featurize.Featurizer(2, 20, label_extractor=w)
     f.featurize_stream(io.StringIO(input_simple))
     self.assertEqual(len(f.dataset), 4)
     self.assertTrue(f.dataset.full)