Ejemplos de BeautifulSoup en Python

Lenguaje de programación: Python

Namespace/Package Name: b4

Clase / Tipo: BeautifulSoup

Ejemplos en hotexamples.com: 8

Python BeautifulSoup - 8 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de b4.BeautifulSoup extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

BeautifulSoup(5)

findAll(3)

find_all(1)

select(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: 27_python.py Proyecto: 321Riccardo/Source-Code-from-Tutorials

def get_single_item_data(item_url):
    source_code = requests.get(item_url)
    plain_text = source_code.text
    soup = BeautifulSoup(plain_text)
    for item_name in soup.findAll('div', {'class': 'i-name'}):
        print(item_name.string)
    for link in soup.findAll('a'):
        href = "https://buckysroom.org" + link.get('href')
        print(href)

Ejemplo n.º 2

Mostrar archivo

def get_single_item_data(item_url):
    source_code = requests.get(item_url)
    plain_text = source_code.text
    soup = BeautifulSoup(plain_text)
    for item_name in soup.findAll('div', {'class': 'i-name'}):
        print(item_name.string)
    for link in soup.findAll('a'):
        href = "https://buckysroom.org" + link.get('href')
        print(href)

Ejemplo n.º 3

Mostrar archivo

Archivo: 26_python.py Proyecto: 321Riccardo/Source-Code-from-Tutorials

def trade_spider(max_pages):
  page = 1
  while page <= max_pages:
    url = 'https://buckysroom.org/trade/search.php?page=' + str(page)
    source_code = requests.get(url)
    plain_text = source_code.text
    soup = BeautifulSoup(plain_text)
    for link in soup.findAll('a', {'class': 'item-name'}):
        href = "https://buckysroom.org" + link.get('href')
        title = link.string
        print(href)
        print(title)
    page += 1

Ejemplo n.º 4

Mostrar archivo

Archivo: crawler.py Proyecto: sarpadda/web-crawler

def trade_spider(max_pages):
    page = 1
    while page <= max_pages:
        url = 'DESIRED WEBSITE' + str(page)
        source_code = requests.get(url)
        plain_text = source_code.text
        soup = BeautifulSoup(plain_text)
        for link in soup.findAll('a', {'class': 'item-name'}):
            href = "DESIRED WEBSITE" + link.get('href')
            title = link.string

            get_single_item_data(href)
        page += 1

Ejemplo n.º 5

Mostrar archivo

def trade_spider(max_pages):
    page = 1
    while page <= max_page:
        url = 'https://buckysroom.org/trade/search.php?page=' + str(page)
        source_code = requests.get(url)
        plain_text = source_code.text
        soup = BeautifulSoup(plain_text)
        for link in soup.findAll('a', {'class': 'item-name'}):
            href = "https://buckysroom.org" + link.get('href')
            title = link.string
            print(href)
            print(title)
        page += 1

Ejemplo n.º 6

Mostrar archivo

Archivo: random_composer.py Proyecto: rickh94/random_composer

def get_composer(number):
    wiki_composer_page = requests.get(
        "https://en.wikipedia.org/wiki/List_of_classical_music_composers_by_era"
    )
    if not wiki_composer_page.ok:
        print("Failed to download list of composers")
        raise SystemExit(1)
    composer_soup = BeautifulSoup(wiki_composer_page.text, "html.parser")
    timelines = composer_soup.find_all("div", class_="timeline-wrapper")
    composer_elements = []
    for item in timelines:
        composer_elements.extend(item.find_all("area"))
    composers = [comp['title'] for comp in composer_elements]

    choices = random.choices(composers, k=number)
    for item in choices:
        print(item)

Ejemplo n.º 7

Mostrar archivo

Archivo: test.py Proyecto: parrot88/ama_scrape

# -*- coding: utf-8 -*-
from b4 import BeautifulSoup
#from b4 import BeautifulSoup
import urllib2
#import os, re, urlparse

#Site = 'https://www.google.co.jp'
Site = 'http://www.yahoo.co.jp/'

soup = BeautifulSoup(urllib2.urlopen(Site), "lxml")
#res = soup.find_all("a")
#res = soup.a.get("href")
res = soup.select('a[href^="http://"]')

for one in res:
    print one

#from pprint import pprint
#pprint(txt)
print 'Finish'

Ejemplo n.º 8

Mostrar archivo

import requests
from b4 import BeautifulSoup

url = "http://kurstenge.kz"
r = requests.get(url)
html = r.text
soup = BeautifulSoup(html, "html.parser")
rows = soup.select("#content table table tr")
for tr in rows:
    print(tr.text)