Exemplo n.º 1
0
    def result(cls, content, site):
        domain = get_domain(site)

        # is ci
        pattern = re.compile(
            ur'<a href="[^"]*{domain}[^"]*" target="_blank">[^<]*</a><div>[^<]*</div>\s*</td>\s*<td>(\d+)<\/td>'.format(
                domain=re.escape(domain)
            ), re.I | re.M | re.S)
        res = pattern.search(content)
        if res:
            return int(res.group(1))

        # is text: Индекс цитирования (тИЦ) ресурса — не определен
        pattern = re.compile(
            ur'<p class="b-cy_error-cy">\s*Индекс цитирования \(тИЦ\) ресурса —\s*не определен', re.I | re.M | re.S
        )
        res = pattern.search(content)
        if res:
            return None

        # is ci
        pattern = re.compile(
            ur'<p class="b-cy_error-cy">\s*Индекс цитирования \(тИЦ\) ресурса —\s*(\d+)', re.I | re.M | re.S
        )
        res = pattern.search(content)
        if res:
            return int(res.group(1))

        raise IncorrectParserError()
Exemplo n.º 2
0
 def get_url(cls, site):
     return cls.base_url.format(domain=get_domain(site))