Python get_parsed_data 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: helper

메소드/함수: get_parsed_data

hotexamples.com에서의 예제들: 6

Python get_parsed_data - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 helper.get_parsed_data에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: ukrnet.py 프로젝트: sersht/news-parser

def parse():
    main_page_url = "https://www.ukr.net/ua/"
    parsed_main_page = helper.get_parsed_data(main_page_url)
    get_news_from_main(parsed_main_page)

    categories = "https://www.ukr.net/news/main.html"
    parsed_categories = helper.get_parsed_data(categories)
    get_news_from_categories(parsed_categories)

예제 #2

파일 보기

파일: ukrnet.py 프로젝트: sersht/news-parser

def get_news_from_categories(parsed_main_page):
    categories_list = get_categories_list(parsed_main_page)
    for category in categories_list:
        parsed_category_page = helper.get_parsed_data("https:" + category[1],
                                                      to_scroll=True)
        get_news_from_category(category[0], parsed_category_page)
        break

예제 #3

파일 보기

def get_images(url):
    try:
        parsed_page = helper.get_parsed_data(url)

        # Save all images links (by tag <img>)
        images = list()
        for image in parsed_page.find(name="div",
                                      attrs={
                                          "class": "h-entry c-main"
                                      }).findAll(name="img"):
            images.append(image["src"])

        return images
    except:
        return list()

예제 #4

파일 보기

def get_content(url):
    parsed_page = helper.get_parsed_data(url)

    article = parsed_page.find(name="article",
                               attrs={"class": "o-cmr u-content-read"})

    if article is None:
        raise ValueError("Didn't recognise as article")

    # Get text iterating article tag-by-tag
    text = str()
    for tag in article.findAll(name="p"):
        for string in tag.stripped_strings:
            text += (string + " ")

    return ("pseudo_title", text, "pseudo_images")

예제 #5

파일 보기

def get_news_from_categories(categories):
    for category in categories:
        parsed_category_page = helper.get_parsed_data(category[1])
        get_news_from_category(category[0], parsed_category_page)
        break

예제 #6

파일 보기

def parse():
    main_page_url = "https://tsn.ua/"
    parsed_main_page = helper.get_parsed_data(main_page_url)

    categories_list = get_categories_list(parsed_main_page)
    get_news_from_categories(categories_list)