Python Page 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: get_pages

클래스/타입: Page

hotexamples.com에서의 예제들: 2

Python Page - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 get_pages.Page에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

select(2)

예제 #1

파일 보기

파일: get_links.py 프로젝트: azzang/get-ahead

from get_pages import Page
import json

soup = Page().getSoup()
states = soup.select('ul.states a')
urls = {}

for state in states:
	soup = Page(state['href']).getSoup()
	state_name = state.getText().strip()
	site_urls = {}
	sites = soup.select('div.content a')
	sites.pop(0)
	for site in sites:
		site_urls[site.getText().strip()] = site['href']
	urls[state_name] = site_urls

with open('urls.json', 'w') as outfile:
    json.dump(urls, outfile)

예제 #2

파일 보기

파일: scrape_and_populate.py 프로젝트: azzang/get-ahead

from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker
from living_wage_database_setup import Base, Location, Wages, Salaries
import os

engine = create_engine(os.environ.get('DATABASE_URL'))
Base.metadata.bind = engine
DBSession = sessionmaker(bind=engine)
session = DBSession()

def add(row):
	session.add(row)
	session.commit()

def addLocation(state, site, comma_index):
	if comma_index != -1:
		site = site[:comma_index]
	location = Location(state = state, site = site)
	add(location)
	return location.id

with open('urls.json') as j:

	urls = json.load(j)

	for state in urls:
		for site, url in urls[state].iteritems():
			loc_id = addLocation(state, site, site.find(','))
			soup = Page(url).getSoup()
			add(Wages(map(lambda w: int(w.getText().strip().replace('$','').replace(',','')), soup.select('.expenses_table td')[105:]), loc_id))
			add(Salaries(map(lambda s: int(s.getText().strip().replace('$','').replace(',','')), soup.select('.occupations_table td')[1::2]), loc_id))