Esempio n. 1
0
 def test_cs_langdetect(self):
     message = Message()
     message.clean_text = \
         "Pravidla českého pravopisu - Pravidla.cz       Psaní i a y Psaní ě Zkratky Tituly Více " \
         "Do hledacího políčka zadejte slovo, které chcete v pravidlech českého pravopisu vyhledat:"
     message = self.stage.do_stage(message)
     self.assertEqual('cs',message.results['mongo_extra']['extra']['lang']['lang'])
Esempio n. 2
0
 def test_ru_langdetect(self):
     message = Message()
     message.clean_text = \
         "Одним из самых популярных направлений является отдых в Турции, " \
         "где роскошные отели всегда готовы к приему гостей."
     message = self.stage.do_stage(message)
     self.assertEqual('ru',message.results['mongo_extra']['extra']['lang']['lang'])
Esempio n. 3
0
 def test_sk_langdetect(self):
     message = Message()
     message.clean_text = \
         "Magazín - Klocher.sk   Hľadaj Zaujímavosti Náhodne  Budúce hviezdy YouTube? #2: Boncamila  2. augusta 2016  " \
         "Z domova ,   Zaujímavosti Podobné  Krok za krokom: Herci z obľúbeného seriálu sa rokmi poriadne zmenili. " \
         "Ako dnes vyzerá fešák J.T. či kráska Karen?! "
     message = self.stage.do_stage(message)
     self.assertEqual('sk',message.results['mongo_extra']['extra']['lang']['lang'])
Esempio n. 4
0
 def test_pt_langdetect(self):
     message = Message()
     message.clean_text = \
         "  idealista — Moradias e apartamentos, arrendamento e venda, anúncios gratuitos       A maneira certa " \
         "de encontrar casa   Português      English     Français     Deutsch     Italiano     Español   idealista.com  " \
         "idealista.it     Inserir anúncio grátis   Acesso  utilizadores   Casa em Matosinhos e Leça da Palmeira"
     message = self.stage.do_stage(message)
     self.assertEqual('pt',message.results['mongo_extra']['extra']['lang']['lang'])
Esempio n. 5
0
 def test_vi_langdetect(self):
     message = Message()
     message.clean_text = \
         "Xổ Số Minh Ngọc *NEW* - Hệ Thống Xổ Số Hiện Đại Nhất         Đăng Ký  Cài Đặt Thông Tin Vé Dò Đăng Xuất Menu  " \
         "   XSMN XSMT XSMB Mega 6/45 Max 4D Dò Vé   Xổ Số Trực Tiếp  Trực Tiếp Xổ Số Miền Nam Trực Tiếp Xổ Số Miền Trung " \
         "Trực Tiếp Xổ Số Miền Bắc Trực Tiếp Xổ Số Điện "
     message = self.stage.do_stage(message)
     self.assertEqual('vi',message.results['mongo_extra']['extra']['lang']['lang'])
Esempio n. 6
0
 def test_pl_langdetect(self):
     message = Message()
     message.clean_text = \
         "DinoAnimals.pl - Zwierzęta, Dinozaury, Rośliny  DinoAnimals.pl DobreSciagi.pl Zonka.pl DinoAnimals.com " \
         "Fakty.DinoAnimals.pl Blogi Galeria Forum 06 12 2016  Subscribe to rss Home Zwierzęta Ssaki Gryzonie " \
         "Hipopotamy Kotowate Koty domowe Lamparty Lwy Tygrysy "
     message = self.stage.do_stage(message)
     self.assertEqual('pl',message.results['mongo_extra']['extra']['lang']['lang'])
Esempio n. 7
0
 def test_kz_langdetect(self):
     message = Message()
     message.clean_text = \
         "Местоположение Павлодар Актау Актобе Алматы Астана Атырау Аягоз Жанаозен Караганда Каскелен Кокшетау " \
         "Костанай Кызылорда Петропавловск Семей Талдыкорган Тараз Темиртау Уральск Усть-Каменогорск Шымкент " \
         "Экибастуз   Тип "
     message = self.stage.do_stage(message)
     self.assertEqual('ru',message.results['mongo_extra']['extra']['lang']['lang'])
Esempio n. 8
0
 def test_ar_langdetect(self):
     message = Message()
     message.clean_text = "موقع نتائج طلاب العراق | القبول المركزي 2016   اطرح سؤال/استفسار " \
                          "   اخر الاخبار    نتائج السادس الاعدادي  نتائج الثالث المتوسط   نتائج السادس" \
                          " الابتدائي  نتائج التعليم المهني  اتصل بنا   نتائج القبول المركزي للكليات" \
                          " والمعاهد العراقية 2016 نتائج قبولات الجامعات العراقية          موقع "
     message = self.stage.do_stage(message)
     self.assertEqual('ar', message.results['mongo_extra']['extra']['lang']['lang'])
Esempio n. 9
0
    def test_clean_message_fields1(self):
        message = Message()
        message.cook = 'good'

        self.assertTrue('cook' in message.__dict__)

        # calling cleaning
        message.clean_fields()

        self.assertFalse('cook' in message.__dict__)
Esempio n. 10
0
    def test_clean_message_results2(self):
        message = Message()
        message.add_result_to_message('ex', 1, 'blarbla')

        self.assertTrue('blarbla' in message.results)

        # calling cleaning
        message.clean_fields()

        self.assertFalse('blarbla' in message.results)

        message.add_result_to_message('ex', 1, 'blarbla')

        self.assertTrue('blarbla' in message.results)

        # calling cleaning
        message.clean_fields()

        self.assertFalse('blarbla' in message.results)
Esempio n. 11
0
 def test_ex3_domain_name(self):
     message = Message()
     message.url = "yandex.ru/qwe/qwe/"
     message = self.stage.do_stage(message)
     self.assertEqual("yandex.ru", message.results['mongo_extra']['domain'])
Esempio n. 12
0
 def test_no_scheme_domain_level(self):
     message = Message()
     message.url = "yandex.ru/qweqwe/"
     message = self.stage.do_stage(message)
     self.assertEqual(2, message.results['mongo_extra']['domain_level'])
Esempio n. 13
0
 def test_1l_no_right_slash_domain_level(self):
     message = Message()
     message.url = "http://yandex.ru"
     message = self.stage.do_stage(message)
     self.assertEqual(1,message.results['mongo_extra']['domain_level'])