def test_fix(self): chunk = Chunk("", ["искуᏟꓚCСTвенный.", "искуᏟꓚCСTвенный cнeг."], "", "", 1) self.checker.fix(chunk) self.assertEqual("искуССССТвенный. искуССССТвенный снег.", chunk.get_mod_text()) # Tор -> first letter is latin chunk = Chunk("", "Tор, HTTP-траффик", "", "", 1) self.checker.fix(chunk) self.assertEqual("Тор, HTTP-траффик", chunk.get_mod_text()) chunk = Chunk("", "Пpoтoкoл Http; шкoлa - école.", "", "", 1) self.checker.fix(chunk) self.assertEqual("Протокол Http; школа - école.", chunk.get_mod_text()) chunk = Chunk("", "Замен нет.", "", "", 1) self.checker.fix(chunk) self.assertEqual("Замен нет.", chunk.get_mod_text()) chunk = Chunk("", ["Замен нет.", "Зaмeны есть.", "Замен нет."], "", "", 1) self.checker.fix(chunk) self.assertEqual("Замен нет. Замены есть. Замен нет.", chunk.get_mod_text())
def test_fix_term_in_the_end(self): checker = chks.SentCorrectnessChecker(['term_in_the_end']) chunk = Chunk("", "Without term ", "", "", 1) checker.fix(chunk) self.assertEqual("Without term.", chunk.get_mod_text()) chunk = Chunk("", ["Without term ", "wo term"], "", "", 1) checker.fix(chunk) self.assertEqual("Without term. wo term.", chunk.get_mod_text()) chunk = Chunk("", ["Boring sent.", "text"], "", "", 1) checker.fix(chunk) self.assertEqual("Boring sent. text.", chunk.get_mod_text())
def test_fix_title_case(self): checker = chks.SentCorrectnessChecker(['title_case']) chunk = Chunk("", "маленькая буква.", "", "", 1) checker.fix(chunk) self.assertEqual("Маленькая буква.", chunk.get_mod_text()) chunk = Chunk( "", ". В основном токсин из организма выводится через почки.", "", "", 1) checker.fix(chunk) self.assertEqual(1, len(chunk.get_mod_sents())) self.assertEqual( "В основном токсин из организма выводится через почки.", chunk.get_mod_text())
def test_fix(self): text = "Ещётакже искуССТвенно содзано биологиеское оржуие (бубоны)." chunk = Chunk("", text, "", "", 1) text2 = "Нет ошибок" chunk2 = Chunk("", text2, "", "", 2) #NO fixes for CPY text3 = "Выливные и распыливающие авиационные приборы" chunk3 = Chunk("", text3, "CPY", "", 1) self.checker.fix_all([chunk, chunk2, chunk3]) self.assertEqual( "Ещётакже искусственно создано биологическое оружие (бубоны).", chunk.get_mod_text()) self.assertEqual("Нет ошибок", chunk2.get_mod_text()) self.assertEqual("Выливные и распыливающие авиационные приборы", chunk3.get_mod_text())
def test_NOT_fix_numbers(self): chunk = Chunk("", "1982г.", "", "", 1) self.checker.fix(chunk) self.assertEqual("1982г.", chunk.get_mod_text())
def test_wiki(self): text = "Уи́льям Си́дни - тонкий" chunk = Chunk("", text, "", "", 1) self.checker.fix_all([chunk]) self.assertEqual("Уи́льям Си́дни - тонкий", chunk.get_mod_text())
def test_abbr(self): text = "(совр. Гаити)" chunk = Chunk("", text, "", "", 1) self.checker.fix_all([chunk]) self.assertEqual("(совр. Гаити)", chunk.get_mod_text())
def test_whitelist(self): text = "ошибкл, не ашибка." chunk = Chunk("", text, "", "", 1) checker = chks.SpellChecker(whitelist=["ашибка"]) checker.fix_all([chunk]) self.assertEqual("ошибка, не ашибка.", chunk.get_mod_text())