Python bs4 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: utils.a_beautiful_soup

메소드/함수: bs4

hotexamples.com에서의 예제들: 6

Python bs4 - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 utils.a_beautiful_soup.bs4에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

 def __init__(self, url):
     super(newpct_page, self).__init__()
     self.url = url
     self.bs4 = bs4(url)
     self.id = url.__hash__()
     self.get_info()
     self.bs4 = None

예제 #2

파일 보기

파일: newpct_series.py 프로젝트: sachablade/python_test

 def get_links_pagination(self, url):
     this_bs4 = bs4(url)
     pre_links = []
     for link in this_bs4.soup.find_all(
             "ul", class_="buscar-list")[0].findAll('a', href=True):
         pre_links.append(link['href'].encode('utf-8'))
     return pre_links

예제 #3

파일 보기

 def __init__(self, url):
     self.url = url
     self.bs4 = bs4(url)
     id = re.findall('\d+', url)
     self.id = id[0]
     self.get_info()
     self.bs4 = None
     super(filmaffinity_page, self).__init__()

예제 #4

파일 보기

def get_links_vo(url):
    return_link_list = []
    this_bs4 = bs4(url)
    for link in this_bs4.get_all_links():
        if any(re.findall(tag_vo, link['href'])):
            if any(re.findall(pagination_vo, link['href'])) and not any(
                    re.findall(pagination_vo, url)):
                return_link_list += get_links_vo(link['href'])
            else:
                if not any(re.findall(pagination_vo, link['href'])):
                    return_link_list.append(link['href'])
    return return_link_list

예제 #5

파일 보기

파일: newpct_series.py 프로젝트: sachablade/python_test

    def __init__(self, url):
        self.url = url
        self.bs4 = bs4(url)
        self.id = url.__hash__()

        file_path = os.path.abspath(
            os.path.join(os.path.join(os.path.dirname(__file__)),
                         os.pardir)) + '/state/newpct_series/%s.json' % self.id
        self.json = self.readJSONfile(file_path)

        self.get_info()
        self.bs4 = None

예제 #6

파일 보기

def get_links_hd(url):
    return_link_list = []
    this_bs4 = bs4(url)
    for link in this_bs4.get_all_links():
        if any(re.findall(tag_hd, link['href'])):
            if any(re.findall(pagination_hd, link['href'])) and not any(
                    re.findall(pagination_hd, url)):
                return_link_list += get_links_hd(link['href'])
            else:
                if not any(re.findall(pagination_hd, link['href'])):
                    return_link_list.append(link['href'])
    #return_link_list = ['http://www.newpct1.com/series-hd/anatomia-de-grey/2259']

    return return_link_list