def test_word_eq(self): r1 = ('мыла', [('мыть', 26.7, [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]), ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'], ['S', 'сред', 'неод', 'род', 'ед'], ['S', 'сред', 'неод', 'вин', 'мн']])]) w1 = mystem.Word(r1[0], r1[1]) r2 = ('мыла', [('мыть', 26.7, [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]), ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'], ['S', 'сред', 'неод', 'род', 'ед'], ['S', 'сред', 'неод', 'вин', 'мн']])]) w2 = mystem.Word(r2[0], r2[1]) self.assertEqual(w1, w2)
def test_word_ctor(self): r = ('мыла', [('мыть', 26.7, [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]), ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'], ['S', 'сред', 'неод', 'род', 'ед'], ['S', 'сред', 'неод', 'вин', 'мн']])]) w = mystem.Word(r[0], r[1]) self.assertEqual(w.orig, 'мыла')
def test_word_str(self): r1 = ('мыла', [('мыть', 26.7, [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]), ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'], ['S', 'сред', 'неод', 'род', 'ед'], ['S', 'сред', 'неод', 'вин', 'мн']])]) w1 = mystem.Word(r1[0], r1[1]) self.assertEqual(str(w1), '<Word instance. Orig: мыла. Lemmas: мыть,мыло>')
def __init__(self, docid=None, text='', word_dict=None): self.docid = docid or id(self) self.text = text self.word_dict = copy.deepcopy(word_dict) if word_dict else {} self.bag = set(self.word_dict.keys()) self.words = [ mystem.Word(orig, lemmas) for orig, lemmas in self.word_dict.items() ]
def test_word_in(self): r1 = ('мыла', [('мыть', 26.7, [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]), ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'], ['S', 'сред', 'неод', 'род', 'ед'], ['S', 'сред', 'неод', 'вин', 'мн']])]) w1 = mystem.Word(r1[0], r1[1]) l1 = mystem.Lemma('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'], ['S', 'сред', 'неод', 'род', 'ед'], ['S', 'сред', 'неод', 'вин', 'мн']]) self.assertTrue(l1 in w1)
def test_document_in(self): words_dict = { 'huge': [('huge', None, None)], 'Мама': [('мама', 313.8, [['S', 'жен', 'од', 'им', 'ед']])], 'мыла': [('мыть', 26.7, [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]), ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'], ['S', 'сред', 'неод', 'род', 'ед'], ['S', 'сред', 'неод', 'вин', 'мн']])], 'раму': [('рама', 22.5, [['S', 'жен', 'неод', 'вин', 'ед']]), ('рам', 0.0, [['S', 'гео', 'муж', 'неод', 'дат', 'ед']])] } text = "huge Мама мыла раму" doc = mystem.Document(1, text, words_dict) r1 = ('мыла', [('мыть', 26.7, [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]), ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'], ['S', 'сред', 'неод', 'род', 'ед'], ['S', 'сред', 'неод', 'вин', 'мн']])]) w1 = mystem.Word(r1[0], r1[1]) self.assertTrue(w1 in doc)