Beispiel #1
0
 def test_word_eq(self):
     r1 = ('мыла', [('мыть', 26.7,
                     [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]),
                    ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'],
                                    ['S', 'сред', 'неод', 'род', 'ед'],
                                    ['S', 'сред', 'неод', 'вин', 'мн']])])
     w1 = mystem.Word(r1[0], r1[1])
     r2 = ('мыла', [('мыть', 26.7,
                     [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]),
                    ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'],
                                    ['S', 'сред', 'неод', 'род', 'ед'],
                                    ['S', 'сред', 'неод', 'вин', 'мн']])])
     w2 = mystem.Word(r2[0], r2[1])
     self.assertEqual(w1, w2)
Beispiel #2
0
 def test_word_ctor(self):
     r = ('мыла', [('мыть', 26.7,
                    [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]),
                   ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'],
                                   ['S', 'сред', 'неод', 'род', 'ед'],
                                   ['S', 'сред', 'неод', 'вин', 'мн']])])
     w = mystem.Word(r[0], r[1])
     self.assertEqual(w.orig, 'мыла')
Beispiel #3
0
 def test_word_str(self):
     r1 = ('мыла', [('мыть', 26.7,
                     [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]),
                    ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'],
                                    ['S', 'сред', 'неод', 'род', 'ед'],
                                    ['S', 'сред', 'неод', 'вин', 'мн']])])
     w1 = mystem.Word(r1[0], r1[1])
     self.assertEqual(str(w1),
                      '<Word instance. Orig: мыла. Lemmas: мыть,мыло>')
Beispiel #4
0
 def __init__(self, docid=None, text='', word_dict=None):
     self.docid = docid or id(self)
     self.text = text
     self.word_dict = copy.deepcopy(word_dict) if word_dict else {}
     self.bag = set(self.word_dict.keys())
     self.words = [
         mystem.Word(orig, lemmas)
         for orig, lemmas in self.word_dict.items()
     ]
Beispiel #5
0
 def test_word_in(self):
     r1 = ('мыла', [('мыть', 26.7,
                     [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]),
                    ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'],
                                    ['S', 'сред', 'неод', 'род', 'ед'],
                                    ['S', 'сред', 'неод', 'вин', 'мн']])])
     w1 = mystem.Word(r1[0], r1[1])
     l1 = mystem.Lemma('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'],
                                      ['S', 'сред', 'неод', 'род', 'ед'],
                                      ['S', 'сред', 'неод', 'вин', 'мн']])
     self.assertTrue(l1 in w1)
Beispiel #6
0
    def test_document_in(self):
        words_dict = {
            'huge': [('huge', None, None)],
            'Мама': [('мама', 313.8, [['S', 'жен', 'од', 'им', 'ед']])],
            'мыла': [('мыть', 26.7,
                      [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]),
                     ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'],
                                     ['S', 'сред', 'неод', 'род', 'ед'],
                                     ['S', 'сред', 'неод', 'вин', 'мн']])],
            'раму': [('рама', 22.5, [['S', 'жен', 'неод', 'вин', 'ед']]),
                     ('рам', 0.0, [['S', 'гео', 'муж', 'неод', 'дат', 'ед']])]
        }

        text = "huge Мама мыла раму"

        doc = mystem.Document(1, text, words_dict)
        r1 = ('мыла', [('мыть', 26.7,
                        [['V', 'несов', 'прош', 'ед', 'изъяв', 'жен', 'пе']]),
                       ('мыло', 16.3, [['S', 'сред', 'неод', 'им', 'мн'],
                                       ['S', 'сред', 'неод', 'род', 'ед'],
                                       ['S', 'сред', 'неод', 'вин', 'мн']])])
        w1 = mystem.Word(r1[0], r1[1])
        self.assertTrue(w1 in doc)