Ejemplo n.º 1
0
 def test_quantile(self):
     t = XArray([1, 2, 3, 4, 5])
     ss = t.sketch_summary()
     self.assertAlmostEqual(3, ss.quantile(0.5), places=1)
     self.assertAlmostEqual(4, ss.quantile(0.8), places=1)
     self.assertAlmostEqual(5, ss.quantile(0.9), places=1)
     self.assertAlmostEqual(5, ss.quantile(0.99), places=1)
Ejemplo n.º 2
0
 def test_quantile(self):
     t = XArray([1, 2, 3, 4, 5])
     ss = t.sketch_summary()
     self.assertAlmostEqual(3, ss.quantile(0.5), places=1)
     self.assertAlmostEqual(4, ss.quantile(0.8), places=1)
     self.assertAlmostEqual(5, ss.quantile(0.9), places=1)
     self.assertAlmostEqual(5, ss.quantile(0.99), places=1)
Ejemplo n.º 3
0
 def test_construct(self):
     t = XArray([1, 2, 3, 4, 5])
     ss = t.sketch_summary()
     self.assertEqual(5, ss.size())
     self.assertEqual(5, ss.max())
     self.assertEqual(1, ss.min())
     self.assertEqual(15, ss.sum())
     self.assertEqual(3, ss.mean())
     self.assertAlmostEqual(1.4142135623730951, ss.std())
     self.assertAlmostEqual(2.0, ss.var())
Ejemplo n.º 4
0
 def test_construct(self):
     t = XArray([1, 2, 3, 4, 5])
     ss = t.sketch_summary()
     self.assertEqual(5, ss.size())
     self.assertEqual(5, ss.max())
     self.assertEqual(1, ss.min())
     self.assertEqual(15, ss.sum())
     self.assertEqual(3, ss.mean())
     self.assertAlmostEqual(1.4142135623730951, ss.std())
     self.assertAlmostEqual(2.0, ss.var())
Ejemplo n.º 5
0
 def test_missing(self):
     t = XArray([None], dtype=int)
     ss = t.sketch_summary()
     self.assertIsNone(ss.min())
     self.assertIsNone(ss.max())
     self.assertEqual(0, ss.mean())
     self.assertEqual(0.0, ss.sum())
     self.assertIsNone(ss.var())
     self.assertIsNone(ss.std())
     self.assertIsNone(ss.max())
     self.assertEqual(0, ss.avg_length())
Ejemplo n.º 6
0
 def test_missing(self):
     t = XArray([None], dtype=int)
     ss = t.sketch_summary()
     self.assertIsNone(ss.min())
     self.assertIsNone(ss.max())
     self.assertEqual(0, ss.mean())
     self.assertEqual(0.0, ss.sum())
     self.assertIsNone(ss.var())
     self.assertIsNone(ss.std())
     self.assertIsNone(ss.max())
     self.assertEqual(0, ss.avg_length())
Ejemplo n.º 7
0
 def test_tf_idf_str(self):
     t = XArray(['this is a test', 'another test'])
     ss = t.sketch_summary()
     tf_idf = ss.tf_idf()
     self.assertEqual({'this': 0.4054651081081644,
                       'a': 0.4054651081081644,
                       'is': 0.4054651081081644,
                       'test': 0.0},
                      tf_idf[0])
     self.assertEqual({'test': 0.0,
                       'another': 0.4054651081081644},
                      tf_idf[1])
Ejemplo n.º 8
0
 def test_tf_idf_str(self):
     t = XArray(['this is a test', 'another test'])
     ss = t.sketch_summary()
     tf_idf = ss.tf_idf()
     self.assertEqual(
         {
             'this': 0.4054651081081644,
             'a': 0.4054651081081644,
             'is': 0.4054651081081644,
             'test': 0.0
         }, tf_idf[0])
     self.assertEqual({
         'test': 0.0,
         'another': 0.4054651081081644
     }, tf_idf[1])
Ejemplo n.º 9
0
 def test_avg_length_dict(self):
     t = XArray([{1: 1, 2: 2, 3: 3, 4: 4}, {5: 5, 6: 6}])
     ss = t.sketch_summary()
     self.assertEqual(3, ss.avg_length())
Ejemplo n.º 10
0
 def test_avg_length_list(self):
     t = XArray([[1, 2, 3, 4], [5, 6]])
     ss = t.sketch_summary()
     self.assertEqual(3, ss.avg_length())
Ejemplo n.º 11
0
 def test_avg_length_float(self):
     t = XArray([1.0, 2.0, 3.0, 4.0, 5.0])
     ss = t.sketch_summary()
     self.assertEqual(1, ss.avg_length())
Ejemplo n.º 12
0
 def test_avg_length_int(self):
     t = XArray([1, 2, 3, 4, 5])
     ss = t.sketch_summary()
     self.assertEqual(1, ss.avg_length())
Ejemplo n.º 13
0
 def test_avg_length_str(self):
     t = XArray(['a', 'bb', 'ccc', 'dddd', 'eeeee'])
     ss = t.sketch_summary()
     self.assertEqual(3, ss.avg_length())
Ejemplo n.º 14
0
 def test_frequent_items(self):
     t = XArray([1, 2, 3, 2])
     ss = t.sketch_summary()
     self.assertEqual({1: 1, 2: 2, 3: 1}, ss.frequent_items())
Ejemplo n.º 15
0
 def test_num_undefined(self):
     t = XArray([1, 2, 3, 4, 5, None])
     ss = t.sketch_summary()
     self.assertEqual(1, ss.num_undefined())
Ejemplo n.º 16
0
 def test_frequency_count(self):
     t = XArray([1, 2, 3, 4, 5, 3])
     ss = t.sketch_summary()
     self.assertEqual(2, ss.frequency_count(3))
Ejemplo n.º 17
0
 def test_frequent_items(self):
     t = XArray([1, 2, 3, 2])
     ss = t.sketch_summary()
     self.assertEqual({1: 1, 2: 2, 3: 1}, ss.frequent_items())
Ejemplo n.º 18
0
 def test_num_unique(self):
     t = XArray([1, 2, 3, 4, 5])
     ss = t.sketch_summary()
     self.assertEqual(5, ss.num_unique())
Ejemplo n.º 19
0
 def test_num_undefined(self):
     t = XArray([1, 2, 3, 4, 5, None])
     ss = t.sketch_summary()
     self.assertEqual(1, ss.num_undefined())
Ejemplo n.º 20
0
 def test_avg_length_empty(self):
     t = XArray([])
     ss = t.sketch_summary()
     self.assertEqual(0, ss.avg_length())
Ejemplo n.º 21
0
 def test_avg_length_str(self):
     t = XArray(['a', 'bb', 'ccc', 'dddd', 'eeeee'])
     ss = t.sketch_summary()
     self.assertEqual(3, ss.avg_length())
Ejemplo n.º 22
0
 def test_avg_length_list(self):
     t = XArray([[1, 2, 3, 4], [5, 6]])
     ss = t.sketch_summary()
     self.assertEqual(3, ss.avg_length())
Ejemplo n.º 23
0
 def test_avg_length_empty(self):
     t = XArray([])
     ss = t.sketch_summary()
     self.assertEqual(0, ss.avg_length())
Ejemplo n.º 24
0
 def test_avg_length_float(self):
     t = XArray([1.0, 2.0, 3.0, 4.0, 5.0])
     ss = t.sketch_summary()
     self.assertEqual(1, ss.avg_length())
Ejemplo n.º 25
0
 def test_num_unique(self):
     t = XArray([1, 2, 3, 4, 5])
     ss = t.sketch_summary()
     self.assertEqual(5, ss.num_unique())
Ejemplo n.º 26
0
 def test_avg_length_int(self):
     t = XArray([1, 2, 3, 4, 5])
     ss = t.sketch_summary()
     self.assertEqual(1, ss.avg_length())
Ejemplo n.º 27
0
 def test_frequency_count(self):
     t = XArray([1, 2, 3, 4, 5, 3])
     ss = t.sketch_summary()
     self.assertEqual(2, ss.frequency_count(3))
Ejemplo n.º 28
0
 def test_avg_length_dict(self):
     t = XArray([{1: 1, 2: 2, 3: 3, 4: 4}, {5: 5, 6: 6}])
     ss = t.sketch_summary()
     self.assertEqual(3, ss.avg_length())