def result(cls, content, site): domain = get_domain(site) # is ci pattern = re.compile( ur'<a href="[^"]*{domain}[^"]*" target="_blank">[^<]*</a><div>[^<]*</div>\s*</td>\s*<td>(\d+)<\/td>'.format( domain=re.escape(domain) ), re.I | re.M | re.S) res = pattern.search(content) if res: return int(res.group(1)) # is text: Индекс цитирования (тИЦ) ресурса — не определен pattern = re.compile( ur'<p class="b-cy_error-cy">\s*Индекс цитирования \(тИЦ\) ресурса —\s*не определен', re.I | re.M | re.S ) res = pattern.search(content) if res: return None # is ci pattern = re.compile( ur'<p class="b-cy_error-cy">\s*Индекс цитирования \(тИЦ\) ресурса —\s*(\d+)', re.I | re.M | re.S ) res = pattern.search(content) if res: return int(res.group(1)) raise IncorrectParserError()
def get_url(cls, site): return cls.base_url.format(domain=get_domain(site))