def mining_line_action(self, title, lang, line): super(MiningOther, self).mining_line_action(title, lang, line) if ignore_start(line) or ignore_italic(line): return if "{" in line or line.startswith("|"): return if re.match(u"^\[\[(Файл:|File:|Image:|Изображение:).+\]\]$", line, re.UNICODE): key = u"Файл или Image" elif line == "[[]]": key = u"только пустые квадратные скобки" elif "[" in line: key = u"квадратные скобки" else: key = u"остальное" append_dict_list(self.mining_other, key, (title, lang, line))
def mining_line_action(self, title, lang, line): super(MiningFigure, self).mining_line_action(title, lang, line) if ignore_start(line) or ignore_italic(line): return if re.match(u'^\{\{прото\|.*$', line, re.UNICODE): return # key = u'прото' elif re.match(u'^\{\{Нужен перевод *(\|\w+)?\}\}$$', line, re.UNICODE): key = u'Нужен перевод' elif re.match(u'^\{\{(длина слова)\|[^}]+\}\}$', line, re.UNICODE): key = u'длина слова' elif re.match(u'^\{\{(илл\.?)\|[^}]+\}\}$', line, re.UNICODE): key = u'шаблон илл' elif line.startswith(u'}} {{пример') \ or line.startswith(u'{{списки семантических связей')\ or line.startswith(u'|'): key = u'списки семантических связей' elif re.match(u'^\{\{(музы|месяцы|неделя) \w+\}\}$', line, re.UNICODE): key = u'музы, месяцы, неделя' elif "{" in line: key = u'другие' else: return append_dict_list(self.mining_figure, key, (title, lang, line))