Python element.Tag.findAll 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: bs4

클래스/타입: element.Tag

메소드/함수: findAll

hotexamples.com에서의 예제들: 5

Python element.Tag.findAll - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 bs4.element.Tag.findAll에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

find_all(30)

find(30)

select(15)

select_one(10)

get(9)

findAll(5)

findChild(4)

findChildren(4)

has_attr(4)

split(4)

get_text(3)

replace(2)

recursiveChildGenerator(2)

append(1)

string(1)

insert_before(1)

replace_with(1)

removesuffix(1)

removeprefix(1)

attrs(1)

getText(1)

wrap(1)

예제 #1

파일 보기

def scrape_tables(table: bs4.element.Tag):
    category = sanitize_str(table.findAll("tr")[0].text.strip())
    columns = json.dumps(
        list(map(sanitize_str,
                 table.findAll("tr")[1].stripped_strings)),
        allow_nan=False,
    )
    grand_total = [0]
    grand_available = [0]
    grand_occupied = [0]
    records = []
    doc = {"category": category, "columns": columns}
    start_time = time.time()
    _multi_process_scrape_partial = functools.partial(
        _multi_process_scrape,
        doc,
        records,
        category,
        grand_total,
        grand_available,
        grand_occupied,
    )
    list(map(_multi_process_scrape_partial, table.findAll("tr")[3:]))
    return {
        "grand_total_beds": grand_total[0],
        "grand_occupied_beds": grand_occupied[0],
        "grand_available_beds": grand_available[0],
        "category": category,
        "columns": columns,
        "records": json.dumps(records, allow_nan=False),
        "hid": hash(doc["category"]),
    }

예제 #2

파일 보기

def extract_detail(item: bs4.element.Tag) -> DetailData:
    """商品に関するデータを抽出する

  Args:
    item (bs4.element.Tag): 商品情報

  Returns:
    商品に関するデータ
  """
    item_review_num = item.findAll(**NUM_REVIEWS_PATTERN_ARGS)
    if len(item_review_num) == 1:
        item_review_num = item_review_num[0].text.strip()

    else:
        item_review_num = [
            ir for ir in item_review_num if ir.text.strip().isdecimal()
        ]
        item_review_num = item_review_num[0].text.strip()

    item_star = item.findAll(**STAR_PATTERN_ARGS)
    if len(item_star) == 1:
        item_star = item_star[0].text.strip()

    else:
        item_star = item_star[-1].text.strip()

    item_review_num = int(item_review_num.replace(',', ''))
    item_star = item_star.split(' ')[-1]
    item_link = item.find(**LINK_PATTERN_ARGS).get('href')
    return DetailData(item_review_num, item_star, item_link)

예제 #3

파일 보기

def parse_song_from_block(block: bs4.element.Tag) -> Song:
    for link in block.findAll("a"):
        if "title" in link.attrs.keys():
            title = link.attrs["title"]

    url = block.findAll("a", {"class": "-download-zip"})[0].attrs["href"]

    return Song(title, url)

예제 #4

파일 보기

def _parse_column(gatherer_column: bs4.element.Tag) -> GathererCard:
    """Parse a single gatherer page 'rightCol' entry."""
    label_to_values = {
        row.find("div", class_="label").getText(strip=True).rstrip(":"):
        row.find("div", class_="value")
        for row in gatherer_column.findAll("div", class_="row")
    }

    card_name = label_to_values["Card Name"].getText(strip=True)
    card_types = label_to_values["Types"].getText(strip=True)

    flavor_lines = []
    if "Flavor Text" in label_to_values:
        for flavorbox in label_to_values["Flavor Text"].findAll(
                "div", class_="flavortextbox"):
            flavor_lines.append(flavorbox.getText(strip=True))

    text_lines = []
    if "Card Text" in label_to_values:
        for textbox in label_to_values["Card Text"].findAll(
                "div", class_="cardtextbox"):
            text_lines.append(_replace_symbols(textbox).getText().strip())

    return GathererCard(
        card_name=card_name,
        original_types=card_types,
        original_text="\n".join(text_lines).strip() or None,
        flavor_text="\n".join(flavor_lines).strip() or None,
    )

예제 #5

파일 보기

파일: yoshigall.py 프로젝트: ManjiKR/ManjiApi

 def tag2list(tag: bs4.element.Tag):
     result = list(map(lambda i: str(i.contents[0]), tag.findAll("p")))
     return result