Python Preprocessing示例

编程语言: Python

命名空间/包名称: LabWorks.algoritms.ldaLib.Preprocessing

类/类型: Preprocessing

hotexamples.com的示例: 9

Python Preprocessing - 已找到9个示例。这些是从开源项目中提取的最受好评的LabWorks.algoritms.ldaLib.Preprocessing.Preprocessing现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

convert_text_to_list_of_words(2)

convert_word_to_normal_form(2)

lemmatize(2)

convert_document_to_list_of_words(1)

convert_list_of_words_to_normal_forms(1)

convert_word_list_to_text(1)

remove_stop_words_from_list_of_words(1)

示例#1

0

显示文件

文件： Dictionary.py 项目： balaremember/data-repo

    def term_to_id(self, term0):

        term = Preprocessing.convert_word_to_normal_form(term0)
        term = Preprocessing.lemmatize(term)
        if not re.match(r'[a-zа-я]+$', term):
            return None
        if self.excluds_stopwords and StopWords.is_stop_word(term):
            return None
        try:
            term_id = self.vocas_id[term]
        except:
            term_id = len(self.vocas)
            self.vocas_id[term] = term_id
            self.vocas.append(term)
            self.docfreq.append(0)
        return term_id

示例#2

0

显示文件

 def get_text_as_list_of_words(self):
     return Preprocessing.convert_text_to_list_of_words(self._text)

示例#3

0

显示文件

文件： preprocessing.py 项目： balaremember/data-repo

 def test_remove_stop_words_from_list_of_words(self):
     answer = Preprocessing.remove_stop_words_from_list_of_words(["Я"], ["Я", "люблю", "тебя"])
     self.assertEqual(answer, ["люблю", "тебя"])

示例#4

0

显示文件

文件： preprocessing.py 项目： balaremember/data-repo

 def test_convert_word_to_normal_form(self):
     word = Preprocessing.convert_word_to_normal_form("гонит")
     self.assertEqual(word, "гнать")

示例#5

0

显示文件

文件： preprocessing.py 项目： balaremember/data-repo

 def test_convert_list_of_words_to_normal_forms(self):
     word_list = Preprocessing.convert_list_of_words_to_normal_forms(["люблю", "тебя"])
     self.assertEqual(word_list, ["любить", "ты"])

示例#6

0

显示文件

文件： preprocessing.py 项目： balaremember/data-repo

 def test_convert_document_to_list_of_words(self):
     doc = Document("Привет как дела")
     word_list = Preprocessing.convert_document_to_list_of_words(doc)
     self.assertEqual(word_list, ["Привет", "как", "дела"])

示例#7

0

显示文件

文件： preprocessing.py 项目： balaremember/data-repo

 def test_convert_text_to_list_of_words(self):
     word_list = Preprocessing.convert_text_to_list_of_words("Привет как дела")
     self.assertEqual(word_list, ["Привет", "как", "дела"])

示例#8

0

显示文件

文件： preprocessing.py 项目： balaremember/data-repo

 def test_lemmatize(self):
     text = Preprocessing.lemmatize("Тебя")
     self.assertEqual("тебя", text)

示例#9

0

显示文件

文件： preprocessing.py 项目： balaremember/data-repo

 def test_convert_word_list_to_text(self):
     word_list = ["re", "wa", "et", "ya"]
     text = Preprocessing.convert_word_list_to_text(word_list)
     self.assertEqual("re wa et ya", text)