Python get_html示例

编程语言: Python

命名空间/包名称: urlOpen

方法/功能: get_html

hotexamples.com的示例: 2

Python get_html - 已找到2个示例。这些是从开源项目中提取的最受好评的urlOpen.get_html现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

def main():
    import urlOpen

    text = urlOpen.get_html("http://www.interfax.ru/world/502926")
    text = tags_filter(text)

    with open("parsed3.html", mode='w', encoding='utf-8') as file:
        file.write(text)
    max_char, min_char, line_list = get_list_of_lines(text)

    for i, c in enumerate(line_list):
        level = max_char * 0.4
        if c[0] >= level and not c[2].startswith("Copyright"):
            print(i, c[0], c[1], c[2])

    print("Max chars in line: {}\n"
          "Min chars in line {}\n"
          "Num of lines {}".format(max_char, min_char, len(line_list)))

示例#2

显示文件

    text = urlOpen.get_html("http://www.interfax.ru/world/502926")
    text = tags_filter(text)

    with open("parsed3.html", mode='w', encoding='utf-8') as file:
        file.write(text)
    max_char, min_char, line_list = get_list_of_lines(text)

    for i, c in enumerate(line_list):
        level = max_char * 0.4
        if c[0] >= level and not c[2].startswith("Copyright"):
            print(i, c[0], c[1], c[2])

    print("Max chars in line: {}\n"
          "Min chars in line {}\n"
          "Num of lines {}".format(max_char, min_char, len(line_list)))


if __name__ == "__main__":
    # main()
    import urlOpen

    html_code = urlOpen.get_html("http://ria.ru/world/20160406/1403678547.html")
    if html_code:
        with open("parsed2.html", mode='w', encoding='utf-8') as file:
            file.write(tags_filter_head_and_script(html_code))

        text = get_text_from_html(html_code)

        with open("parsed3.html", mode='w', encoding='utf-8') as file:
            file.write(text)