Esempi in Python per BeautifulSoup.init

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: bs4

Classe/tipologia: BeautifulSoup

Metodo/funzione: __init__

Esempi su hotexamples.com: 19

BeautifulSoup.__init__ in Python: 19 esempi trovati. Questi sono i migliori esempi reali in Python per bs4.BeautifulSoup.__init__, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

append(30)

BeautifulSoup(30)

__str__(30)

__init__(11)

attrs(10)

__len__(8)

__repr__(3)

__unicode__(2)

article(2)

__copy__(2)

__getattr__(2)

first(2)

findAllNext(2)

feed(1)

currentTag(1)

fartind(1)

BF(1)

filter_wikilinks(1)

fina_all(1)

fnd_all(1)

h1(1)

replace_with(1)

td(1)

toCSV(1)

copy(1)

alcohol(1)

astype(1)

assign(1)

apply(1)

add_structure(1)

add_shared_term(1)

a(1)

_title(1)

_repr_html_(1)

_find_all(1)

_all_strings(1)

__getitem__(1)

__contains__(1)

NavigableString(1)

Date(1)

wrap(1)

Esempio n. 1

Mostra file

File: geturl.py Progetto: jzou2000/codex

 def __init__(self, url, cache=None):
     self.url = url
     self.cache = cache
     try:
         f = None
         if self.cache is not None and os.path.exists(self.cache):
             # cache exists and use it instead
             fname = self.cache
             f = open(self.cache, 'r')
         else:
             fname = self.url
             f = urllib2.urlopen(self.url)
         page = f.read()
         f.close()
         if self.cache is not None and not os.path.exists(self.cache):
             # cache specified but it doesn't exist, create one
             with open(self.cache, 'w') as f:
                 f.write(page)
         # check encoding and convert into utf-8 if it is not
         #     alternation: use from_encoding="encoding"
         #         todo: can from_encoding replace charset=?
         m = re.search(r'charset=([^ "\']+)', page, flags=re.I)
         if m:
             encoding = m.group(1)
             ##print 'encoding={}\n    {}'.format(encoding, fname)
             charset = 'charset={}'.format(encoding)
             if re.match(r'gb2312', encoding, re.IGNORECASE):
                 encoding = 'gb18030'
             page = unicode(page, encoding)
             page = re.sub(charset, 'charset=UTF-8', page, flags=re.IGNORECASE)
         BeautifulSoup.__init__(self, page)
     except Exception, ex:
         print("Fail to load url {}\n{}".format(self.url, ex))
         raise ex

Esempio n. 2

Mostra file

File: Page.py Progetto: JDongian/Neolib

 def __init__(self, url, usr=None, session=None, postData=None, vars=None, proxy=None):
     self.url = url
     self.postData = postData
     self.vars = vars
     
     if not session and not usr:
         if postData:
             r = requests.post(url, data=postData, headers=vars, proxies=proxy)
         else:
             r = requests.get(url, headers=vars, proxies=proxy)
     elif usr:
         if postData:
             r = usr.session.post(url, data=postData, headers=vars, proxies=proxy)
         else:
             r = usr.session.get(url, headers=vars, proxies=proxy)
     elif session:
         if postData:
             r = session.post(url, data=postData, headers=vars, proxies=proxy)
         else:
             r = session.get(url, headers=vars, proxies=proxy)
     
     self.resp = r
     self.request = r.request
     self.header = r.headers
     self.content = r.text
     self.usr = usr
     
     if "text/html" in r.headers['content-type']:
         BeautifulSoup.__init__(self, r.content)
     else:
         self.content = r.content

Esempio n. 3

Mostra file

File: html.py Progetto: jmdwebsites/jmdwebsites_source

 def __init__(self, html_doc, html_parser, *args, **kwargs):
     BeautifulSoup.__init__(self, html_doc, html_parser, *args, **kwargs)
     # html5lib adds a head, html and body to docs without them,
     # so remove if not in original doc
     if html_parser == 'html5lib':
         if html_doc.find('<head') < 0:
             self.find('head').decompose()
         if html_doc.find('<html') < 0:
             self.find('html').unwrap()
         if html_doc.find('<body') < 0:
             self.find('body').unwrap()

Esempio n. 4

Mostra file

 def __init__(self, number):
     import config
     res = ""
     status = 1
     request_url = config.emudepot_url.format(number)
     request = urllib2.Request(request_url, headers=config.header)
     try:
         res = urllib2.urlopen(request, timeout=5).read()
         status = 1
     except Exception as error:
         print("hook/depotHook.py: Error: Request error occurs")
         print(error)
         status = 0
     print("hook/depotHook.py: Info: depotHook module loaded: {}".format(
         number))
     BeautifulSoup.__init__(self, res, features="html.parser")

Esempio n. 5

Mostra file

File: Page.py Progetto: Python3pkg/Neolib

    def __init__(self,
                 url,
                 usr=None,
                 session=None,
                 postData=None,
                 vars=None,
                 proxy=None):
        self.url = url
        self.postData = postData
        self.vars = vars

        if not session and not usr:
            if postData:
                r = requests.post(url,
                                  data=postData,
                                  headers=vars,
                                  proxies=proxy)
            else:
                r = requests.get(url, headers=vars, proxies=proxy)
        elif usr:
            if postData:
                r = usr.session.post(url,
                                     data=postData,
                                     headers=vars,
                                     proxies=proxy)
            else:
                r = usr.session.get(url, headers=vars, proxies=proxy)
        elif session:
            if postData:
                r = session.post(url,
                                 data=postData,
                                 headers=vars,
                                 proxies=proxy)
            else:
                r = session.get(url, headers=vars, proxies=proxy)

        self.resp = r
        self.request = r.request
        self.header = r.headers
        self.content = r.text
        self.usr = usr

        if "text/html" in r.headers['content-type']:
            BeautifulSoup.__init__(self, r.content)
        else:
            self.content = r.content

Esempio n. 6

Mostra file

File: epub-bs.py Progetto: jzou2000/codex

 def __init__(self, src, encode = 'utf-8', selector = None):
     if os.path.exists(src):
         with codecs.open(src, 'r', encode) as fp:
             BeautifulSoup.__init__(self, fp)
         self.filename = src
         self.sourceString = None
     else:
         BeautifulSoup.__init__(self, src)
         self.filename = None
         self.sourceString = src
     self.selector = selector
     c = self.select(selector)
     if c:
         self.mainContent = c[0]
     else:
         self.mainContent = self.body
     self.img = []
     self.styles = [ c.get('href')
         for c in self.find_all('meta', rel= 'stylesheet') ]

Esempio n. 7

Mostra file

File: maps.py Progetto: ejobrien/visbio

 def __init__(self, infile):
     _BS.__init__(self, infile, ["lxml", "xml"])

Esempio n. 8

Mostra file

File: craigslist_parser.py Progetto: mohsinhaider/craigsbot

 def __init__(self, markup):
     BeautifulSoup.__init__(self, markup, 'html.parser')

Esempio n. 9

Mostra file

File: scrap.py Progetto: drtagkim/yp2017

 def __init__(self,content):
     BS.__init__(self,content,"lxml")

Esempio n. 10

Mostra file

File: _html.py Progetto: sfall/mechanize3

 def __init__(self, encoding, text=None, avoidParserProblems=True,
              initialTextIsEverything=True):
     self._encoding = encoding
     BeautifulSoup.__init__(
         self, text, avoidParserProblems, initialTextIsEverything)

Esempio n. 11

Mostra file

File: testing.py Progetto: Cromlech/cromlech.browser

 def __init__(self, *args, **kwargs):
     if 'features' not in kwargs:
         kwargs['features'] = 'xml'
     BeautifulSoup.__init__(self, *args, **kwargs)

Esempio n. 12

Mostra file

File: maps.py Progetto: jonm4024/cobrapy

 def __init__(self, infile):
     BeautifulSoup.__init__(self, infile, ["lxml", "xml"])

Esempio n. 13

Mostra file

 def __init__(self, *args, **kwargs):
     BeautifulSoup.__init__(self, *args, **kwargs)

Esempio n. 14

Mostra file

File: scraper.py Progetto: jaromajdz/Teoniteapp

 def __init__(self, url):
     BeautifulSoup.__init__(self, self.get_page(url), 'html.parser')

Esempio n. 15

Mostra file

File: parsers.py Progetto: xpinguin/leprocrawl

	def __init__(self, raw_html, **kwargs):
		BeautifulSoup.__init__(self, markup = raw_html, features = "lxml")
		_parse_greeting(self, **kwargs)

Esempio n. 16

Mostra file

 def __init__(self,req):
     BS.__init__(self,req.content,"lxml")
     self.req=req

Esempio n. 17

Mostra file

 def __init__(self, html):
     BeautifulSoup.__init__(self, html, 'html.parser')

Esempio n. 18

Mostra file

    def __init__(self, ip=None):

        self.ip = ip
        self.data = fetch_data(ip=self.ip)
        BeautifulSoup.__init__(self, self.data, 'lxml')

Esempio n. 19

Mostra file

File: maps.py Progetto: ejobrien/visbio

 def __init__(self, infile):
     _BS.__init__(self, infile, ["lxml", "xml"])

Esempi in Python per BeautifulSoup.__init__

Esempi in Python per BeautifulSoup.init