Ejemplos de Parser.find_elements_by_tag en Python

Lenguaje de programación: Python

Namespace/Package Name: src.parser

Clase / Tipo: Parser

Método / Función: find_elements_by_tag

Ejemplos en hotexamples.com: 2

Python Parser.find_elements_by_tag - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de src.parser.Parser.find_elements_by_tag extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Parser(30)

parse(30)

get_parser(6)

evaluate(5)

collate_words(4)

_format_regex(2)

get_season(2)

find_elements_by_tag(2)

get_league(2)

get_yr_parser(2)

get_arguments(2)

get_document_tree(2)

load_config(1)

lexer(1)

load(1)

has_more_commands(1)

get_tr_arr_from_tbody(1)

get_today_data(1)

make_sentences(1)

number_of_letters(1)

make_words_with_timings(1)

menu(1)

needReparse(1)

get_table(1)

number_of_paragraph(1)

number_of_words(1)

openConfigurationFile(1)

parseCameraSettings(1)

parseDevicesMeta(1)

parseExtensions(1)

parseMinuteData(1)

parseProjectMeta(1)

parseSensorMeta(1)

removeStopwords(1)

tokenise(1)

get_teams_day(1)

get_post_row(1)

get_skill_list(1)

fixture1(1)

_get_top_results(1)

_parse_line(1)

_update_pkg_files(1)

addData(1)

advance(1)

book_name(1)

build(1)

build_command(1)

build_operation(1)

countBlocks(1)

Ejemplo n.º 1

Mostrar archivo

    def get_title_for_article(self):
        """Fetch the article title and analyze it

        Assumptions:
        - title tag is the most reliable (inherited from Goose)
        - h1, if properly detected, is the best (visible to users)
        - og:title and h1 can help improve the title extraction
        - python == is too strict, often we need to compare filtered
          versions, i.e. lowercase and ignoring special chars

        Explicit rules:
        1. title == h1, no need to split
        2. h1 similar to og:title, use h1
        3. title contains h1, title contains og:title, len(h1) > len(og:title), use h1
        4. title starts with og:title, use og:title
        5. use title, after splitting
        """
        title = ''
        text_title = Parser.find_elements_by_tag(self.root, 'title')[0].text

        h1s = Parser.find_elements_by_tag(self.root, 'h1') or []
        h1s_text = Parser.rejoin_group_text([h1.text for h1 in h1s])
        if h1s_text:
            h1s_text.sort(key=len, reverse=True)
            h1_title = h1s_text[0]

            if len(h1_title) <= 5:
                h1_title = ''

        fb_title = ()

Ejemplo n.º 2

Mostrar archivo

def get_record_link(node, prefix):
    a_tags = Parser.find_elements_by_tag(node, 'a')
    if a_tags is None or len(a_tags) == 0:
        return '#'
    url = a_tags[0].get('href')
    i = 1
    while url == "#" and i < len(a_tags):
        url = a_tags[i].get('href')
        i += 1
    if url is None or len(url) == 0:
        return '#'
    return prefix + url if not url.startswith(prefix) else url