Python tf_idf примеры использования

Язык программирования: Python

Пространство имен/Пакет: daeso.string.tf_idf

Метод/Функция: tf_idf

Примеров на hotexamples.com: 13

Python tf_idf - 13 примеров найдено. Это лучшие примеры Python кода для daeso.string.tf_idf.tf_idf, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Пример #1

Показать файл

Файл: test_tf_idf.py Проект: emsrc/daeso-framework

 def test_tf_idf_5(self):
     dtc = [ ["a", "b", "a", "c"], 
             ["b", "d"] ]
     w = tf_idf(dtc)
     self.assertEqual(w, (["a", "b", "c", "d"],
                          [[2/4.0 * log(2/1.0), # a
                            1/4.0 * log(2/2.0), # b 
                            1/4.0 * log(2/1.0), # c
                            0/4.0 * log(2/1.0)  # d
                            ], 
                            [0/2.0 * log(2/1.0), # a
                             1/2.0 * log(2/2.0), # b 
                             0/2.0 * log(2/1.0), # c
                             1/2.0 * log(2/1.0)  # d
                         ] 
                       ]))

Пример #2

Показать файл

Файл: test_tf_idf.py Проект: emsrc/daeso-framework

 def test_tf_idf_5(self):
     dtc = [["a", "b", "a", "c"], ["b", "d"]]
     w = tf_idf(dtc)
     self.assertEqual(
         w,
         (
             ["a", "b", "c", "d"],
             [
                 [
                     2 / 4.0 * log(2 / 1.0),  # a
                     1 / 4.0 * log(2 / 2.0),  # b 
                     1 / 4.0 * log(2 / 1.0),  # c
                     0 / 4.0 * log(2 / 1.0)  # d
                 ],
                 [
                     0 / 2.0 * log(2 / 1.0),  # a
                     1 / 2.0 * log(2 / 2.0),  # b 
                     0 / 2.0 * log(2 / 1.0),  # c
                     1 / 2.0 * log(2 / 1.0)  # d
                 ]
             ]))

Пример #3

Показать файл

def tf_idf_indicator_weight(terms_per_elem):
    # consider the pair of documents as a combined collection 
    # of N-single sentence documents
    # tf is either 1 or 0, depending on wether the term occurs in the sentence
    terms, weights = tf_idf(terms_per_elem, normalized=True, indicator=True)
    return weights

Пример #4

Показать файл

Файл: test_tf_idf.py Проект: emsrc/daeso-framework

 def test_tf_idf_empty_3(self):
     dtc = [["a"], []]
     self.assertEqual(tf_idf(dtc), (["a"], [[1 / 1 * log(2 / 1)], [0.0]]))

Пример #5

Показать файл

Файл: test_tf_idf.py Проект: emsrc/daeso-framework

 def test_tf_idf_1(self):
     dtc = [["a"]]
     w = tf_idf(dtc)
     self.assertEqual(w, (["a"], [[1 / 1.0 * log(1 / 1.0)]]))

Пример #6

Показать файл

Файл: test_tf_idf.py Проект: emsrc/daeso-framework

 def test_tf_idf_empty_2(self):
     dtc = [[]]
     self.assertEqual(tf_idf(dtc), ([], [[]]))

Пример #7

Показать файл

Файл: test_tf_idf.py Проект: emsrc/daeso-framework

 def test_tf_idf_empty_1(self):
     dtc = []
     self.assertEqual(tf_idf(dtc), ([], []))

Пример #8

Показать файл

Файл: test_tf_idf.py Проект: emsrc/daeso-framework

 def test_tf_idf_4(self):
     dtc = [["a"], ["b"]]
     w = tf_idf(dtc)
     self.assertEqual(w, (["a", "b"], [[1 / 1 * log(2 / 1.0), 0.0],
                                       [0.0, 1 / 1 * log(2 / 1.0)]]))

Пример #9

Показать файл

Файл: test_tf_idf.py Проект: emsrc/daeso-framework

 def test_tf_idf_1(self):
     dtc = [ ["a"] ]
     w = tf_idf(dtc)
     self.assertEqual(w, (["a"], 
                          [[1/1.0 * log(1/1.0)]]))

Пример #10

Показать файл

Файл: test_tf_idf.py Проект: emsrc/daeso-framework

 def test_tf_idf_empty_3(self):
     dtc = [["a"], []]
     self.assertEqual(tf_idf(dtc), (["a"], [[1/1 * log(2/1)], [0.0]]))

Пример #11

Показать файл

Файл: test_tf_idf.py Проект: emsrc/daeso-framework

 def test_tf_idf_empty_2(self):
     dtc = [[]]
     self.assertEqual(tf_idf(dtc), ([], [[]]))

Пример #12

Показать файл

Файл: test_tf_idf.py Проект: emsrc/daeso-framework

 def test_tf_idf_empty_1(self):
     dtc = []
     self.assertEqual(tf_idf(dtc), ([], []))

Пример #13

Показать файл

Файл: test_tf_idf.py Проект: emsrc/daeso-framework

 def test_tf_idf_4(self):
     dtc = [ ["a"], ["b"] ]
     w = tf_idf(dtc)
     self.assertEqual(w, (["a", "b"],
                          [[1/1 * log(2/1.0), 0.0], 
                           [0.0, 1/1 * log(2/1.0)]]))