Esempi in Python per HTMLParser.__init__, esempi in Python per HTMLParser.HTMLParser.__init__

Esempio n. 1

0

Mostra file

File: html_parser.py Progetto: taylordelehanty/pokedex

def __init__(self):
    HTMLParser.__init__(self)
    self.recording = 0
    self.data = []

    def handle_starttag(self, tag, attributes):
        if tag != 'td':
            return
        if self.recording:
            self.recording += 1
            return
        for name, value in attributes:
            if name == 'class' and value == 'cen':
                break
            else:
                return
        self.recording = 1

    def handle_endtag(self, tag):
        if tag == 'td' and self.recording:
            self.recording -= 1

    def handle_data(self, data):
        if 'TM' in data and self.recording:
            self.data.append(data)

Esempio n. 2

0

Mostra file

File: parsers.py Progetto: a1exsh/pgweb

	def __init__(self):
		HTMLParser.__init__(self)
		self.lasttag = None
		self.title = ""
		self.pagedata = StringIO()
		self.links = []
		self.inbody = False

Esempio n. 3

0

Mostra file

File: cvedetails.py Progetto: LeGaulois/soc

    def __init__(self):
        HTMLParser.__init__(self)
        self.trouve=False
        self.encours=False
        self.reponse={}
        self.correspondance={
            'CVSS Score':'cvss_score',
            'Confidentiality Impact':'confidentialite',
            'Integrity Impact':'integrite',
            'Availability Impact':'disponibilite',
            'Access Complexity':'complexite',
            'Authentication':'authentification',
            'Vulnerability Type(s)':'type',
            'CWE ID':None,
            'Gained Access':'acces_obtention'
        }

        self.reponse={
            'cvss_score':None,
            'confidentialite':None,
            'integrite':None,
            'disponibilite':None,
            'complexite':None,
            'authentification':None,
            'type':None,
            'acces_obtention':None
        }

        self.precedent=None

Esempio n. 4

0

Mostra file

File: myepisodes2.py Progetto: qwerdy/MyFlexget

    def __init__(self, day='tomorrow'):
        HTMLParser.__init__(self)
        if day == 'today':
            self.theDay = date.today()
        elif day == 'yesterday':
            self.theDay = date.today() - timedelta(1)
        elif day == 'tomorrow':
            self.theDay = date.today() + timedelta(1)
        else:
            self.theDay = None

        self.in_episode = False
        self.in_date = False
        self.in_dateA = False
        self.in_validep = False
        self.in_showname = False
        self.in_number = False
        self.date_format = "%d-%b-%Y"
        self.shows = []
        self.buffshow = {}

        if self.theDay is not None:
            one_day_ago = (self.theDay - timedelta(1)).strftime(self.date_format)
            two_day_ago = (self.theDay - timedelta(2)).strftime(self.date_format)
            three_day_ago = (self.theDay - timedelta(3)).strftime(self.date_format)
            four_day_ago = (self.theDay - timedelta(4)).strftime(self.date_format)

            self.theDay = self.theDay.strftime(self.date_format)
            self.previous_lookup = [self.theDay, one_day_ago, two_day_ago, three_day_ago, four_day_ago]

Esempio n. 5

0

Mostra file

File: preferences.py Progetto: tuxnani/pyrhmn

    def __init__(self, site = None):
        HTMLParser.__init__(self)
        dict.__init__(self, ())
        self.in_form = False
        self.select = None

        if site: self.load(site)

Esempio n. 6

0

Mostra file

File: htmlutils.py Progetto: AlbertoPeon/invenio

 def __init__(self):
     """ Constructor; initializes washer """
     HTMLParser.__init__(self)
     self.result = ''
     self.nb = 0
     self.previous_nbs = []
     self.previous_type_lists = []
     self.url = ''
     self.render_unallowed_tags = False
     self.allowed_tag_whitelist = \
             CFG_HTML_BUFFER_ALLOWED_TAG_WHITELIST
     self.allowed_attribute_whitelist = \
             CFG_HTML_BUFFER_ALLOWED_ATTRIBUTE_WHITELIST
     # javascript:
     self.re_js = re.compile( ".*(j|&#106;|&#74;)"\
                             "\s*(a|&#97;|&#65;)"\
                             "\s*(v|&#118;|&#86;)"\
                             "\s*(a|&#97;|&#65;)"\
                             "\s*(s|&#115;|&#83;)"\
                             "\s*(c|&#99;|&#67;)"\
                             "\s*(r|&#114;|&#82;)"\
                             "\s*(i|&#195;|&#73;)"\
                             "\s*(p|&#112;|&#80;)"\
                             "\s*(t|&#112;|&#84)"\
                             "\s*(:|&#58;).*", re.IGNORECASE | re.DOTALL)
     # vbscript:
     self.re_vb = re.compile( ".*(v|&#118;|&#86;)"\
                             "\s*(b|&#98;|&#66;)"\
                             "\s*(s|&#115;|&#83;)"\
                             "\s*(c|&#99;|&#67;)"\
                             "\s*(r|&#114;|&#82;)"\
                             "\s*(i|&#195;|&#73;)"\
                             "\s*(p|&#112;|&#80;)"\
                             "\s*(t|&#112;|&#84;)"\
                             "\s*(:|&#58;).*", re.IGNORECASE | re.DOTALL)

Esempio n. 7

0

Mostra file

File: vk_auth.py Progetto: grishasobol/VKFinder

 def __init__(self):
     HTMLParser.__init__(self)
     self.url = None
     self.params = {}
     self.in_form = False
     self.form_parsed = False
     self.method = "GET"

Esempio n. 8

0

Mostra file

File: deedScraperLib.py Progetto: antievictionmappingproject/deedscraper

 def __init__(self):
     HTMLParser.__init__(self)
     self.in_records_table = False
     self.record = -1
     self.column = -1
     self.data_row = False
     self.data = []

Esempio n. 9

0

Mostra file

File: bugzillaSummaryParser.py Progetto: drdee/bingle

 def __init__(self, properties):
     HTMLParser.__init__(self)
     self.properties = dict((key, value) for key, value in (prop.split(',')
                            for prop in properties.split(';') if prop.find(',') > -1))
     self.data = []
     self.in_td = 0
     self.tr_name = None

Esempio n. 10

0

Mostra file

File: utilclasses.py Progetto: jnoga/iTxoko-backend

	def __init__(self):
		HTMLParser.__init__(self)
		self.subjectList = {}
		self.tagi = 0
		self.tdi = 0
		self.dataFlag = 0
		self.subName = ""

Esempio n. 11

0

Mostra file

File: test_converter.py Progetto: Comcast/WebKitForWayland

    def __init__(self, new_path, filename, reference_support_info, host=Host(), convert_test_harness_links=True):
        HTMLParser.__init__(self)

        self._host = host
        self._filesystem = self._host.filesystem
        self._webkit_root = WebKitFinder(self._filesystem).webkit_base()

        self.converted_data = []
        self.converted_properties = []
        self.converted_property_values = []
        self.in_style_tag = False
        self.style_data = []
        self.filename = filename
        self.reference_support_info = reference_support_info

        resources_path = self.path_from_webkit_root('LayoutTests', 'resources')
        resources_relpath = self._filesystem.relpath(resources_path, new_path)
        self.new_test_harness_path = resources_relpath
        self.convert_test_harness_links = convert_test_harness_links

        # These settings might vary between WebKit and Blink
        self._css_property_file = self.path_from_webkit_root('Source', 'WebCore', 'css', 'CSSPropertyNames.in')
        self._css_property_value_file = self.path_from_webkit_root('Source', 'WebCore', 'css', 'CSSValueKeywords.in')

        self.test_harness_re = re.compile('/resources/testharness')

        self.prefixed_properties = self.read_webkit_prefixed_css_property_list(self._css_property_file)
        prop_regex = '([\s{]|^)(' + "|".join(prop.replace('-webkit-', '') for prop in self.prefixed_properties) + ')(\s+:|:)'
        self.prop_re = re.compile(prop_regex)

        self.prefixed_property_values = self.read_webkit_prefixed_css_property_list(self._css_property_value_file)
        prop_value_regex = '(:\s*|^\s*)(' + "|".join(value.replace('-webkit-', '') for value in self.prefixed_property_values) + ')(\s*;|\s*}|\s*$)'
        self.prop_value_re = re.compile(prop_value_regex)

Esempio n. 12

0

Mostra file

File: htmlparser.py Progetto: serkanh/scrapy

    def __init__(self, tag="a", attr="href", process=None, unique=False):
        HTMLParser.__init__(self)

        self.scan_tag = tag if callable(tag) else lambda t: t == tag
        self.scan_attr = attr if callable(attr) else lambda a: a == attr
        self.process_attr = process if callable(process) else lambda v: v
        self.unique = unique

Esempio n. 13

0

Mostra file

File: MyParser.py Progetto: blxlrsmb/uknow

	def __init__(self, feed_data):
		HTMLParser.__init__(self)
		self.courses = tuple()
		self.is_course = False
		self.is_coursename = False
		self.is_homework = False
		self.feed(feed_data)

Esempio n. 14

0

Mostra file

File: tangshi_list_v2.py Progetto: AliceSaraOtt/PythonPros

 def __init__(self):
     HTMLParser.__init__(self)
     self.in_div = False
     self.in_a = False
     self.pattern = re.compile(r'(.*)\((.*)\)')
     self.tangshi_list = []
     self.current_poem = {}

Esempio n. 15

0

Mostra file

File: check_data.py Progetto: wusui/toybox

 def __init__(self):
     HTMLParser.__init__(self)
     self.glink = False
     self.elink = False
     self.ingroup = []
     self.href = ''
     self.name = ''

Esempio n. 16

0

Mostra file

File: gamescraper.py Progetto: tomshen/steamscraper

	def __init__(self):
		HTMLParser.__init__(self)
		self.foundName = False
		self.foundDescription = False
		self.foundPrice = False
		self.foundScore = True
		self.gameInfo = {}

Esempio n. 17

0

Mostra file

File: HTMLTreeBuilder.py Progetto: Annatara/nimbus

 def __init__(self, builder=None, encoding=None):
     self.__stack = []
     if builder is None:
         builder = ElementTree.TreeBuilder()
     self.__builder = builder
     self.encoding = encoding or "iso-8859-1"
     HTMLParser.__init__(self)

Esempio n. 18

0

Mostra file

File: html_source.py Progetto: AndrewHay/lesswrong

 def __init__(self, *a, **kw):
     self.indent = '';
     HTMLParser.__init__(self, *a, **kw)
     self.processed_text = ''
     self.tagtracker = []
     self.error_line = 0
     self.line_number = 1

Esempio n. 19

0

Mostra file

File: renrenAlbumDownloader.py Progetto: zeroomega/renrenAlbumDownloader

 def __init__(self):
     #super(formParser, self).__init__()
     HTMLParser.__init__(self)
     self.dict = {}
     self.stack = []
     self.post=""
     pass

Esempio n. 20

0

Mostra file

File: html.py Progetto: edugasser/misEjemplos

 def __init__(self, pdf):
     HTMLParser.__init__(self)
     self.style = {}
     self.pre = False
     self.href = ''
     self.align = ''
     self.page_links = {}
     self.font_list = ("times","courier", "helvetica")
     self.font = None
     self.font_stack = [] 
     self.pdf = pdf
     self.r = self.g = self.b = 0
     self.indent = 0
     self.bullet = []
     self.set_font("times", 12)
     self.font_face = "times"    # initialize font
     self.color = 0              #initialize font color
     self.table = None           # table attributes
     self.table_col_width = None # column (header) widths
     self.table_col_index = None # current column index
     self.td = None              # cell attributes
     self.th = False             # header enabled
     self.tr = None
     self.theader = None           # table header cells
     self.tfooter = None           # table footer cells
     self.thead = None
     self.tfoot = None
     self.theader_out = self.tfooter_out = False

Esempio n. 21

0

Mostra file

File: WunschlisteFeed.py Progetto: OpenEnigma2/enigma2-plugins

	def __init__(self):
		HTMLParser.__init__(self)
		self.title = False
		self.updated = False
		self.titlestr = ''
		self.updatedstr = ''
		self.list = []

Esempio n. 22

0

Mostra file

File: parseLastFm.py Progetto: charlie-kim/lastArchive

 def __init__(self):
     HTMLParser.__init__(self)
     self.tracks = []
     self.endDate = None
     self.curData = ''
     self.curTrack = {}
     self.recording = None

Esempio n. 23

0

Mostra file

File: branding.py Progetto: gitter-badger/rogerthat-backend

 def __init__(self, translationFoundCallback):
     HTMLParser.__init__(self)
     self.translationFoundCallback = translationFoundCallback
     self.recording = False
     self.js_translations_script_found = False
     self.js_rogerthat_script_found = False
     self._js_rogerthat_script_regex = re.compile('rogerthat/rogerthat-(\d+\.)+js')

Esempio n. 24

0

Mostra file

File: html.py Progetto: wangking/formbuilder

 def __init__(self, text, closed=("input", "link")):
     HTMLParser.__init__(self)
     self.tree = self.parent = TAG[""]()
     self.closed = closed
     self.tags = [x for x in __all__ if isinstance(eval(x), DIV)]
     self.last = None
     self.feed(text)

Esempio n. 25

0

Mostra file

File: MyHTMLParser.py Progetto: hockbase/backup

 def __init__(self):
     HTMLParser.__init__(self)
     self.flag = 0
     self.links = []
     self.title = ""
     self.img= ""
     self.content = ""

Esempio n. 26

0

Mostra file

File: getslope.py Progetto: nadre/websearch_ir

	def __init__(self):
		HTMLParser.__init__(self)
		self.tag_count = 0
		self.token_count = 0
		self.in_script = False
		self.slope = []
		self.slope.append((0,0))

Esempio n. 27

0

Mostra file

File: 4.py Progetto: serg0987/python

 def __init__(self, fh):
     """
     {fh} must be an input stream returned by open() or urllib2.urlopen()
     """
     HTMLParser.__init__(self)
     self.fileids = []
     self.feed(fh.read())

Esempio n. 28

0

Mostra file

File: Page1Parser.py Progetto: drankincms/RateMon

 def __init__(self):
     HTMLParser.__init__(self)
     self.InRow=0
     self.InEntry=0
     self.table =  []
     self.tmpRow = []
     self.hyperlinks = []
     self.RunNumber = 0
     self.TriggerRates = []
     self.Nevts = []
     self.LiveLumiByLS = []
     self.DeliveredLumiByLS = []
     self.FirstLS = -1
     self.LastLS = -1
     self.AvLiveLumi = []
     self.AvDeliveredLumi = []
     self.AvDeadtime = []
     self.DeadTime = []#grant
     self.L1Prescales=[]
     self.RunPage = ''
     self.RatePage = ''
     self.LumiPage = ''
     self.L1Page=''
     self.L1_LS_Page = ''#grant
     self.PrescaleColumn=[]
     self.PrescaleColumnString = ''

Esempio n. 29

0

Mostra file

File: db_parser.py Progetto: gbinside/pysvg

 def __init__(self, html=None):
     self._conn = make_db_connection()
     self._sort_order = 0
     HTMLParser.__init__(self)
     self._tag_tree = []
     if html is not None:
         self.feed(html)

Esempio n. 30

0

Mostra file

File: ZingMP3Parser.py Progetto: vantam1990/OnlineMusicDownloader

    def __init__(self, url):
        """Returns new Sequence object with specified url

        url: link to mp3.zing.vn web page
        """
        HTMLParser.__init__(self)
        self.song_name = []
        self.song_artist = []
        self.song_link = []
        self.song_type = []
        req = urlopen(url)  # open connection to web page
        data = None
        if req.info().get('Content-Encoding') == "gzip":
            buf = StringIO( req.read())
            f = gzip.GzipFile(fileobj=buf)
            data = f.read().split("\n")
        else:
            data = req.read().split("\n")  # split web page with \n
        feed_data = None
        for param in data:
            if (param.find('<param name="flashvars" value="') > -1):
                """Find line to get xml url
                """
                feed_data = param
                break
        self.feed(feed_data)  # parser html data

Esempio n. 31

0

Mostra file

 def __init__(self):
     HTMLParser.__init__(self)
     self.links = []

Esempio n. 32

0

Mostra file

File: tools.py Progetto: wtakase/indico

 def __init__(self, sanitizationLevel=_defaultSanitizationLevel):
     HTMLParser.__init__(self)
     if sanitizationLevel not in range(0, 3):
         sanitizationLevel = self._defaultSanitizationLevel
     self._sanitizationLevel = sanitizationLevel

Esempio n. 33

0

Mostra file

File: 6douban_client.py Progetto: thoftheocean/spiderStage

 def __init__(self):
     HTMLParser.__init__(self)
     self.ck = None

Esempio n. 34

0

Mostra file

File: 6douban_client.py Progetto: thoftheocean/spiderStage

 def __init__(self):
     HTMLParser.__init__(self)
     self.captcha_id = None
     self.captcha_url = None

Esempio n. 35

0

Mostra file

File: urbandict.py Progetto: eartsar/tidiscordbot

 def __init__(self, *args, **kwargs):
     HTMLParser.__init__(self, *args, **kwargs)
     self._section = None
     self.translations = []

Esempio n. 36

0

Mostra file

 def __init__(self):
     HTMLParser.__init__(self)
     self.terms = []

Esempio n. 37

0

Mostra file

 def __init__(self):
     HTMLParser.__init__(self)
     self.boxes = []
     self.__line_text = None
     self.__char_positions = None

Esempio n. 38

0

Mostra file

 def __init__(self, *args, **kwargs):
     HTMLParser.__init__(self, *args, **kwargs)
     self.elements = set()

Esempio n. 39

0

Mostra file

 def __init__(self, scale):
     HTMLParser.__init__(self)
     self.__scale = scale
     self.__sio = StringIO()
     self.map_id = ''

Esempio n. 40

0

Mostra file

 def __init__(self, placeToStadium):
     HTMLParser.__init__(self)
     self.m_rawSchedule = []
     self.m_placeToStadium = placeToStadium

Esempio n. 41

0

Mostra file

File: worksheet_listing.py Progetto: jm58660/sagenb

 def __init__(self):
     HTMLParser.__init__(self)
     self.worksheets = []

Esempio n. 42

0

Mostra file

    def __init__(self):

        HTMLParser.__init__(self)

        self.data = list()
        self.recording = False

Esempio n. 43

0

Mostra file

File: html_rewriter.py Progetto: tilgovi/pywb

 def __init__(self, *args, **kwargs):
     HTMLParser.__init__(self)
     super(HTMLRewriter, self).__init__(*args, **kwargs)

Esempio n. 44

0

Mostra file

 def __init__(self):
     HTMLParser.__init__(self)
     self.links = {}
     self.tag_now = ""
     self.endtag = ['br', 'img']

Esempio n. 45

0

Mostra file

 def __init__(self):
     HTMLParser.__init__(self)
     self.intag = ''

Esempio n. 46

0

Mostra file

File: parse.py Progetto: sauravray2587/idne

 def __init__(self, folder):
     HTMLParser.__init__(self)
     self.folder = folder
     self.num_tests = 0
     self.testcase = None
     self.start_copy = False

Esempio n. 47

0

Mostra file

 def __init__(self):
     HTMLParser.__init__(self)
     self.flag = False
     self.peacekeeper_score = ''

Esempio n. 48

0

Mostra file

 def __init__(self):
     # Old style class in py2 :(
     HTMLParser.__init__(self)
     self.hrefs = []

Esempio n. 49

0

Mostra file

 def __init__(self):
     HTMLParser.__init__(self)
     self.data = []

Esempio n. 50

0

Mostra file

 def __init__(self, parent_path, *args, **kwargs):
     self.parent_path_parts = parent_path.split("/")[:-1]
     #SGMLParser is an old style classe
     HTMLParser.__init__(self, *args, **kwargs)

Esempio n. 51

0

Mostra file

File: html_parser.py Progetto: akhdir/price-extraction

 def __init__(self):
     HTMLParser.__init__(self)
     self.count = 0
     self.price = ''

Esempio n. 52

0

Mostra file

 def __init__(self):
     HTMLParser.__init__(self)
     self.__text = []

Esempio n. 53

0

Mostra file

File: Models.py Progetto: whigg/Paper-Scraper

 def __init__(self, request_data):
     HTMLParser.__init__(self)
     self.pre_flag = False
     #		self.data_format=data_format
     self.record_tag = "pre"
     self.request_data = request_data

Esempio n. 54

0

Mostra file

 def __init__(self):
     self.strlst = []
     self.a = False
     HTMLParser.__init__(self)

Esempio n. 55

0

Mostra file

 def __init__(self):
     HTMLParser.__init__(self)
     self.pdf = ''

Esempio n. 56

0

Mostra file

 def __init__(self, baseHref):
     HTMLParser.__init__(self)
     self.baseHref = baseHref
     self.staticContent = []
     self.externalLinks = []
     self.internalLinks = []

Esempio n. 57

0

Mostra file

File: dist.py Progetto: jacdevos/trac

 def __init__(self, out):
     HTMLParser.__init__(self)
     self.out = out
     self.in_javascript = False

Esempio n. 58

0

Mostra file

File: summary.py Progetto: hooops/PersonalWebsite

 def __init__(self, count):
     HTMLParser.__init__(self)
     self.count = count
     self.summary = u''

Esempio n. 59

0

Mostra file

File: get_image2.py Progetto: 114zax514/dic

 def __init__(self):
     HTMLParser.__init__(self)

Esempio n. 60

0

Mostra file

 def __init__(self):
     HTMLParser.__init__(self)
     self.papers = []
     self.start = False