Ejemplos de extract_nodes en Python, ejemplos de elifetools.utils.extract_nodes en Python

Ejemplo n.º 1

0

Mostrar archivo

def conflict(soup):
    conflict_tags = extract_nodes(soup, "fn", attr="fn-type", value="conflict")
    conflict_tags += extract_nodes(soup,
                                   "fn",
                                   attr="fn-type",
                                   value="COI-statement")
    return conflict_tags

Ejemplo n.º 2

0

Mostrar archivo

def custom_meta(soup, meta_name=None):
    custom_meta_tags = extract_nodes(soup, "custom-meta")
    if meta_name is not None:
        custom_meta_tags = [
            tag for tag in custom_meta_tags if node_contents_str(
                first(extract_nodes(tag, "meta-name"))) == meta_name
        ]
    return custom_meta_tags

Ejemplo n.º 3

0

Mostrar archivo

def fn_group(soup, content_type=None):
    if content_type:
        return extract_nodes(soup,
                             "fn-group",
                             attr="content-type",
                             value=content_type)
    else:
        return extract_nodes(soup, "fn-group")

Ejemplo n.º 4

0

Mostrar archivo

def pub_id(soup, pub_id_type=None):
    if pub_id_type:
        return extract_nodes(soup,
                             "pub-id",
                             attr="pub-id-type",
                             value=pub_id_type)
    else:
        return extract_nodes(soup, "pub-id")

Ejemplo n.º 5

0

Mostrar archivo

def ext_link(soup, ext_link_type=None):
    if ext_link_type:
        return extract_nodes(soup,
                             "ext-link",
                             attr="ext-link-type",
                             value=ext_link_type)
    else:
        return extract_nodes(soup, "ext-link")

Ejemplo n.º 6

0

Mostrar archivo

def abstract(soup, abstract_type=None):
    if abstract_type:
        return extract_nodes(soup,
                             "abstract",
                             attr="abstract-type",
                             value=abstract_type)
    else:
        return extract_nodes(soup, "abstract")

Ejemplo n.º 7

0

Mostrar archivo

def authors(soup, contrib_type="author"):
    if contrib_type:
        return extract_nodes(soup,
                             "contrib",
                             attr="contrib-type",
                             value=contrib_type)
    else:
        return extract_nodes(soup, "contrib")

Ejemplo n.º 8

0

Mostrar archivo

def pub_date(soup, date_type=None, pub_type=None):
    if date_type is not None:
        return extract_nodes(soup,
                             "pub-date",
                             attr="date-type",
                             value=date_type)
    elif pub_type is not None:
        return extract_nodes(soup, "pub-date", attr="pub-type", value=pub_type)
    else:
        return extract_nodes(soup, "pub-date")

Ejemplo n.º 9

0

Mostrar archivo

def journal_issn(soup, pub_format, pub_type):
    if pub_format is None and pub_type is None:
        # return the first issn tag found regardless of which type
        return first(extract_nodes(soup, "issn"))
    elif pub_format is not None:
        return first(
            extract_nodes(soup,
                          "issn",
                          attr="publication-format",
                          value=pub_format))
    elif pub_type is not None:
        return first(
            extract_nodes(soup, "issn", attr="pub-type", value=pub_type))

Ejemplo n.º 10

0

Mostrar archivo

def journal_id(soup):
    # the first non-nil tag
    return firstnn(
        extract_nodes(soup,
                      "journal-id",
                      attr="journal-id-type",
                      value="publisher-id"))

Ejemplo n.º 11

0

Mostrar archivo

def author_keywords(soup):
    # A few articles have kwd-group with no kwd-group-type, so account for those
    tags = extract_nodes(soup, "kwd-group")
    keyword_tags = []
    for tag in tags:
        if (tag.get("kwd-group-type") == "author-keywords"
                or tag.get("kwd-group-type") is None):
            keyword_tags += [tag for tag in tag if tag.name == "kwd"]
    return keyword_tags

Ejemplo n.º 12

0

Mostrar archivo

def article_contributors(soup):
    article_meta_tag = article_meta(soup)
    if article_meta_tag:
        contributor_tags = extract_nodes(article_meta_tag,
                                         ["contrib", "on-behalf-of"])
        return [
            tag for tag in contributor_tags
            if tag.parent.name == "contrib-group"
        ]

Ejemplo n.º 13

0

Mostrar archivo

def research_organism_keywords(soup):
    tags = first(
        extract_nodes(soup,
                      "kwd-group",
                      attr="kwd-group-type",
                      value="research-organism"))
    if not tags:
        return None
    return [tag for tag in tags if tag.name == "kwd"] or None

Ejemplo n.º 14

0

Mostrar archivo

def full_subject_area(soup, subject_group_type=None):

    subject_group_tags = extract_nodes(soup, "subj-group")
    subject_group_tags = [
        tag for tag in subject_group_tags
        if tag.parent.name == "article-categories"
        and tag.parent.parent.name == "article-meta"
    ]

    if subject_group_type:
        subject_group_tags = list(
            filter(
                lambda tag: tag.get("subj-group-type" == subject_group_type)))

    return subject_group_tags

Ejemplo n.º 15

0

Mostrar archivo

def subject_area(soup, subject_group_type=None):
    # Supports all subject areas or just particular ones filtered by
    subject_area_tags = []
    tags = extract_nodes(soup, "subject")

    subject_area_tags = [
        tag for tag in tags if tag.parent.name == "subj-group"
        and tag.parent.parent.name == "article-categories"
        and tag.parent.parent.parent.name == "article-meta"
    ]
    if subject_group_type:
        subject_area_tags = [
            tag for tag in tags
            if tag.parent.get("subj-group-type") == subject_group_type
        ]
    return subject_area_tags

Ejemplo n.º 16

0

Mostrar archivo

def fig_group(soup):
    return extract_nodes(soup, "fig-group")

Ejemplo n.º 17

0

Mostrar archivo

def string_name(soup):
    return extract_nodes(soup, "string-name")

Ejemplo n.º 18

0

Mostrar archivo

def principal_award_recipient(soup):
    return extract_nodes(soup, "principal-award-recipient")

Ejemplo n.º 19

0

Mostrar archivo

def award_group(soup):
    return extract_nodes(soup, "award-group")

Ejemplo n.º 20

0

Mostrar archivo

def funding_group(soup):
    return extract_nodes(soup, "funding-group")

Ejemplo n.º 21

0

Mostrar archivo

def journal_title(soup):
    return first(extract_nodes(soup, "journal-title"))

Ejemplo n.º 22

0

Mostrar archivo

def article_type(soup):
    # returns raw data, just that the data doesn't contain any BS nodes
    return first(extract_nodes(soup, "article")).get("article-type")

Ejemplo n.º 23

0

Mostrar archivo

def article_meta(soup):
    return first(extract_nodes(soup, "article-meta"))

Ejemplo n.º 24

0

Mostrar archivo

def fig(soup):
    return extract_nodes(soup, "fig")

Ejemplo n.º 25

0

Mostrar archivo

def math(soup):
    return extract_nodes(soup, "math")

Ejemplo n.º 26

0

Mostrar archivo

def disp_formula(soup):
    return extract_nodes(soup, "disp-formula")

Ejemplo n.º 27

0

Mostrar archivo

def publisher(soup):
    return first(extract_nodes(soup, "publisher-name"))

Ejemplo n.º 28

0

Mostrar archivo

def list(soup):  # Redefining `list` could be problematic
    return extract_nodes(soup, "list")

Ejemplo n.º 29

0

Mostrar archivo

def boxed_text(soup):
    return extract_nodes(soup, "boxed-text")

Ejemplo n.º 30

0

Mostrar archivo

def list_item(soup):
    return extract_nodes(soup, "list-item")