Python match Examples, zim.parsing.url_re.match Python Examples

Example #1

0

Show file

 def dump_link(self, tag, attrib, strings=None):
     href = attrib['href']
     text = u''.join(strings) or href
     if href == text and url_re.match(href):
         return href
     else:
         return ['"%s":%s' % (text, href)]

Example #2

0

Show file

 def dump_link(self, tag, attrib, strings=None):
     assert 'href' in attrib, \
      'BUG: link misses href: %s "%s"' % (attrib, strings)
     href = self.linker.link(attrib['href'])
     text = ''.join(strings) or href
     if href == text and url_re.match(href):
         return ['<', href, '>']
     else:
         return ['[%s](%s)' % (text, href)]

Example #3

0

Show file

File: markdown.py Project: gdw2/zim

	def dump_link(self, tag, attrib, strings=None):
		assert 'href' in attrib, \
			'BUG: link misses href: %s "%s"' % (attrib, strings)
		href = self.linker.link(attrib['href'])
		text = u''.join(strings) or href
		if href == text and url_re.match(href):
			return ['<', href, '>']
		else:
			return ['[%s](%s)' % (text, href)]

Example #4

0

Show file

	def dump_link(self, tag, attrib, strings=None):
		assert 'href' in attrib, \
			'BUG: link misses href: %s "%s"' % (attrib, strings)
		href = attrib['href']

		if not strings or href == u''.join(strings):
			if url_re.match(href):
				return (href,) # no markup needed
			else:
				return ('[[', href, ']]')
		else:
			return ('[[', href, '|') + tuple(strings) + (']]',)

Example #5

0

Show file

File: wiki.py Project: gdw2/zim

	def dump_link(self, tag, attrib, strings=None):
		assert 'href' in attrib, \
			'BUG: link misses href: %s "%s"' % (attrib, strings)
		href = attrib['href']

		if not strings or href == u''.join(strings):
			if url_re.match(href):
				return (href,) # no markup needed
			else:
				return ('[[', href, ']]')
		else:
			return ('[[', href, '|') + tuple(strings) + (']]',)

Example #6

0

Show file

File: markdown.py Project: DarioGT/Zim-QDA

    def dump_children(self, list, output, list_level=-1, list_type=None, list_iter='0'):
        if list.text:
            output.append(list.text)

        for element in list.getchildren():
            if element.tag in ('p', 'div'):
                indent = 0
                if 'indent' in element.attrib:
                    indent = int(element.attrib['indent'])
                myoutput = TextBuffer()
                self.dump_children(element, myoutput) # recurs
                # OPEN ISSUE: no indent for para
                #if indent:
                #    myoutput.prefix_lines('\t'*indent)
                output.extend(myoutput)
            elif element.tag == 'h':
                level = int(element.attrib['level'])
                if level < 1:   level = 1
                elif level > 5: level = 5

                if level in (1, 2):
                    # setext-style headers for lvl 1 & 2
                    if level == 1: char = '='
                    else: char = '-'
                    heading = element.text
                    line = char * len(heading)
                    output.append(heading + '\n')
                    output.append(line)
                else:
                    # atx-style headers for deeper levels
                    tag = '#' * level
                    output.append(tag + ' ' + element.text)
            elif element.tag in ('ul', 'ol'):
                indent = int(element.attrib.get('indent', 0))
                start = element.attrib.get('start')
                myoutput = TextBuffer()
                self.dump_children(element, myoutput, list_level=list_level+1, list_type=element.tag, list_iter=start) # recurs
                # OPEN ISSUE: no indent for para
                #if indent:
                #    myoutput.prefix_lines('\t'*indent)
                if list_level == -1:
                    # Need empty lines around lists in markdown
                    output.append('\n')
                    output.extend(myoutput)
                    output.append('\n')
                else:
                    output.extend(myoutput)
            elif element.tag == 'li':
                if 'indent' in element.attrib:
                    # HACK for raw trees from pageview
                    list_level = int(element.attrib['indent'])

                if list_type == 'ol':
                    bullet = str(list_iter) + '.'
                    list_iter = increase_list_iter(list_iter) or '1' # fallback if iter not valid
                else:
                    bullet = bullet_types[element.attrib.get('bullet', BULLET)]
                output.append('\t'*list_level+bullet+' ')
                self.dump_children(element, output, list_level=list_level) # recurs
                output.append('\n')
            elif element.tag == 'pre':
                indent = 0
                if 'indent' in element.attrib:
                    indent = int(element.attrib['indent'])
                myoutput = TextBuffer()
                myoutput.append(element.text)
                # OPEN ISSUE: no indent for para
                #if indent:
                #    myoutput.prefix_lines('\t'*indent)
                myoutput.prefix_lines('\t') # verbatim is always indented
                output.extend(myoutput)
            elif element.tag == 'link':
                assert 'href' in element.attrib, \
                    'BUG: link %s "%s"' % (element.attrib, element.text)
                href = self.linker.link(element.attrib['href'])
                text = element.text or href
                if href == text and url_re.match(href):
                    output.append('<' + href + '>')
                else:
                    output.append('[%s](%s)' % (text, href))
            elif element.tag == 'img':
                src = self.linker.img(element.attrib['src'])
                # OPEN ISSUE: image properties used in zim not supported in pandoc
                #opts = []
                #items = element.attrib.items()
                # we sort params only because unit tests don't like random output
                #items.sort()
                #for k, v in items:
                #    if k == 'src' or k.startswith('_'):
                #        continue
                #    elif v: # skip None, "" and 0
                #        opts.append('%s=%s' % (k, v))
                #if opts:
                #    src += '?%s' % '&'.join(opts)

                text = element.text or ''
                output.append('![%s](%s)' % (text, src))
            elif element.tag in dumper_tags:
                if element.text:
                    tag = dumper_tags[element.tag]
                    output.append(tag + element.text + tag)
            else:
                assert False, 'Unknown node type: %s' % element

            if element.tail:
                output.append(element.tail)

Example #7

0

Show file

File: wiki.py Project: DarioGT/Zim-QDA

    def dump_children(self, list, output, list_level=-1, list_type=None, list_iter='0'):
        if list.text:
            output.append(list.text)

        for element in list.getchildren():
            if element.tag in ('p', 'div'):
                indent = 0
                if 'indent' in element.attrib:
                    indent = int(element.attrib['indent'])
                myoutput = TextBuffer()
                self.dump_children(element, myoutput) # recurs
                if indent:
                    myoutput.prefix_lines('\t'*indent)
                output.extend(myoutput)
            elif element.tag == 'h':
                level = int(element.attrib['level'])
                if level < 1:   level = 1
                elif level > 5: level = 5
                tag = '='*(7 - level)
                output.append(tag+' '+element.text+' '+tag)
            elif element.tag in ('ul', 'ol'):
                indent = int(element.attrib.get('indent', 0))
                start = element.attrib.get('start')
                myoutput = TextBuffer()
                self.dump_children(element, myoutput, list_level=list_level+1, list_type=element.tag, list_iter=start) # recurs
                if indent:
                    myoutput.prefix_lines('\t'*indent)
                output.extend(myoutput)
            elif element.tag == 'li':
                if 'indent' in element.attrib:
                    # HACK for raw trees from pageview
                    list_level = int(element.attrib['indent'])
                if list_type == 'ol':
                    bullet = str(list_iter) + '.'
                    list_iter = increase_list_iter(list_iter) or '1' # fallback if iter not valid
                elif 'bullet' in element.attrib: # ul OR raw tree from pageview...
                    if element.attrib['bullet'] in bullet_types:
                        bullet = bullet_types[element.attrib['bullet']]
                    else:
                        bullet = element.attrib['bullet'] # Assume it is numbered..
                else: # ul
                    bullet = '*'
                output.append('\t'*list_level+bullet+' ')
                self.dump_children(element, output, list_level=list_level) # recurs
                output.append('\n')
            elif element.tag == 'pre':
                indent = 0
                if 'indent' in element.attrib:
                    indent = int(element.attrib['indent'])
                myoutput = TextBuffer()
                myoutput.append("'''\n"+element.text+"'''\n")
                if indent:
                    myoutput.prefix_lines('\t'*indent)
                output.extend(myoutput)
            elif element.tag == 'img':
                src = element.attrib['src']
                opts = []
                items = element.attrib.items()
                # we sort params only because unit tests don't like random output
                items.sort()
                for k, v in items:
                    if k == 'src' or k.startswith('_'):
                        continue
                    elif v: # skip None, "" and 0
                        opts.append('%s=%s' % (k, v))
                if opts:
                    src += '?%s' % '&'.join(opts)

                if element.text:
                    output.append('{{'+src+'|'+element.text+'}}')
                else:
                    output.append('{{'+src+'}}')

            elif element.tag == 'sub':
                output.append("_{%s}" % element.text)
            elif element.tag == 'sup':
                output.append("^{%s}" % element.text)
            elif element.tag == 'link':
                assert 'href' in element.attrib, \
                    'BUG: link %s "%s"' % (element.attrib, element.text)
                href = element.attrib['href']
                if href == element.text:
                    if url_re.match(href):
                        output.append(href)
                    else:
                        output.append('[['+href+']]')
                else:
                    if element.text:
                        output.append('[['+href+'|'+element.text+']]')
                    else:
                        output.append('[['+href+']]')

            elif element.tag in dumper_tags:
                if element.text:
                    tag = dumper_tags[element.tag]
                    output.append(tag+element.text+tag)
            else:
                assert False, 'Unknown node type: %s' % element

            if element.tail:
                output.append(element.tail)

Example #8

0

Show file

File: wiki.py Project: damiansimanuk/texslide

	def dump_children(self, list, output, list_level=-1):
		if list.text:
			output.append(list.text)

		for element in list.getchildren():
			if element.tag == 'p':
				indent = 0
				if 'indent' in element.attrib:
					indent = int(element.attrib['indent'])
				myoutput = TextBuffer()
				self.dump_children(element, myoutput) # recurs
				if indent:
					myoutput.prefix_lines('\t'*indent)
				output.extend(myoutput)
			elif element.tag == 'ul':
				self.dump_children(element, output, list_level=list_level+1) # recurs
			elif element.tag == 'h':
				level = int(element.attrib['level'])
				if level < 1:   level = 1
				elif level > 5: level = 5
				tag = '='*(7 - level)
				output.append(tag+' '+element.text+' '+tag)
			elif element.tag == 'li':
				if 'indent' in element.attrib:
					list_level = int(element.attrib['indent'])
				if 'bullet' in element.attrib:
					bullet = bullet_types[element.attrib['bullet']]
				else:
					bullet = '*'
				output.append('\t'*list_level+bullet+' ')
				self.dump_children(element, output, list_level=list_level) # recurs
				output.append('\n')
			elif element.tag == 'pre':
				output.append("'''\n"+element.text+"'''\n")
			elif element.tag == 'img':
				src = element.attrib['src']
				opts = []
				for k, v in element.attrib.items():
					if k == 'src' or k.startswith('_'):
						continue
					else:
						opts.append('%s=%s' % (k, v))
				if opts:
					src += '?%s' % '&'.join(opts)
				if element.text:
					output.append('{{'+src+'|'+element.text+'}}')
				else:
					output.append('{{'+src+'}}')
			elif element.tag == 'link':
				assert 'href' in element.attrib, \
					'BUG: link %s "%s"' % (element.attrib, element.text)
				href = element.attrib['href']
				if href == element.text:
					if url_re.match(href):
						output.append(href)
					else:
						output.append('[['+href+']]')
				else:
					output.append('[['+href+'|'+element.text+']]')
			elif element.tag in dumper_tags:
				tag = dumper_tags[element.tag]
				output.append(tag+element.text+tag)
			else:
				assert False, 'Unknown node type: %s' % element

			if element.tail:
				output.append(element.tail)