コード例 #1
0
    def test_fix(self):
        chunk = Chunk("", ["искуᏟꓚCСTвенный.", "искуᏟꓚCСTвенный cнeг."], "",
                      "", 1)
        self.checker.fix(chunk)
        self.assertEqual("искуССССТвенный. искуССССТвенный снег.",
                         chunk.get_mod_text())

        # Tор -> first letter is latin
        chunk = Chunk("", "Tор, HTTP-траффик", "", "", 1)
        self.checker.fix(chunk)
        self.assertEqual("Тор, HTTP-траффик", chunk.get_mod_text())

        chunk = Chunk("", "Пpoтoкoл Http; шкoлa - école.", "", "", 1)
        self.checker.fix(chunk)
        self.assertEqual("Протокол Http; школа - école.", chunk.get_mod_text())

        chunk = Chunk("", "Замен нет.", "", "", 1)
        self.checker.fix(chunk)
        self.assertEqual("Замен нет.", chunk.get_mod_text())

        chunk = Chunk("", ["Замен нет.", "Зaмeны есть.", "Замен нет."], "", "",
                      1)
        self.checker.fix(chunk)
        self.assertEqual("Замен нет. Замены есть. Замен нет.",
                         chunk.get_mod_text())
コード例 #2
0
    def test_fix_term_in_the_end(self):
        checker = chks.SentCorrectnessChecker(['term_in_the_end'])

        chunk = Chunk("", "Without term   ", "", "", 1)
        checker.fix(chunk)
        self.assertEqual("Without term.", chunk.get_mod_text())

        chunk = Chunk("", ["Without term  ", "wo term"], "", "", 1)
        checker.fix(chunk)
        self.assertEqual("Without term. wo term.", chunk.get_mod_text())

        chunk = Chunk("", ["Boring sent.", "text"], "", "", 1)
        checker.fix(chunk)
        self.assertEqual("Boring sent. text.", chunk.get_mod_text())
コード例 #3
0
    def test_fix_title_case(self):
        checker = chks.SentCorrectnessChecker(['title_case'])

        chunk = Chunk("", "маленькая буква.", "", "", 1)
        checker.fix(chunk)
        self.assertEqual("Маленькая буква.", chunk.get_mod_text())

        chunk = Chunk(
            "", ". В основном токсин из организма выводится через почки.", "",
            "", 1)
        checker.fix(chunk)
        self.assertEqual(1, len(chunk.get_mod_sents()))
        self.assertEqual(
            "В основном токсин из организма выводится через почки.",
            chunk.get_mod_text())
コード例 #4
0
    def test_fix(self):
        text = "Ещётакже искуССТвенно содзано биологиеское оржуие (бубоны)."
        chunk = Chunk("", text, "", "", 1)
        text2 = "Нет ошибок"
        chunk2 = Chunk("", text2, "", "", 2)
        #NO fixes for CPY
        text3 = "Выливные и распыливающие авиационные приборы"
        chunk3 = Chunk("", text3, "CPY", "", 1)

        self.checker.fix_all([chunk, chunk2, chunk3])
        self.assertEqual(
            "Ещётакже искусственно создано биологическое оружие (бубоны).",
            chunk.get_mod_text())

        self.assertEqual("Нет ошибок", chunk2.get_mod_text())

        self.assertEqual("Выливные и распыливающие авиационные приборы",
                         chunk3.get_mod_text())
コード例 #5
0
 def test_NOT_fix_numbers(self):
     chunk = Chunk("", "1982г.", "", "", 1)
     self.checker.fix(chunk)
     self.assertEqual("1982г.", chunk.get_mod_text())
コード例 #6
0
 def test_wiki(self):
     text = "Уи́льям Си́дни - тонкий"
     chunk = Chunk("", text, "", "", 1)
     self.checker.fix_all([chunk])
     self.assertEqual("Уи́льям Си́дни - тонкий", chunk.get_mod_text())
コード例 #7
0
 def test_abbr(self):
     text = "(совр. Гаити)"
     chunk = Chunk("", text, "", "", 1)
     self.checker.fix_all([chunk])
     self.assertEqual("(совр. Гаити)", chunk.get_mod_text())
コード例 #8
0
 def test_whitelist(self):
     text = "ошибкл, не ашибка."
     chunk = Chunk("", text, "", "", 1)
     checker = chks.SpellChecker(whitelist=["ашибка"])
     checker.fix_all([chunk])
     self.assertEqual("ошибка, не ашибка.", chunk.get_mod_text())