Ejemplos de strip_control_characters en Python

Lenguaje de programación: Python

Namespace/Package Name: miner.text.util

Método / Función: strip_control_characters

Ejemplos en hotexamples.com: 4

Python strip_control_characters - 4 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de miner.text.util.strip_control_characters extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

Archivo: etl.py Proyecto: Bartelo/openjumo

def html_to_story(doc, strip_control_chars=True):
    try:
        # Send the HTML over to Data Science Toolkit
        story = urllib2.urlopen( '/'.join([settings.DSTK_API_BASE, 'html2story']), data=doc).read()
        
        story = json.loads(story).get('story', '')
        
        if strip_control_chars:
            story = strip_control_characters(story)
        return story
    except urllib2.URLError, e:
        return ''

Ejemplo n.º 2

Mostrar archivo

Archivo: etl.py Proyecto: sidosangwon/openjumo

def html_to_story(doc, strip_control_chars=True):
    try:
        # Send the HTML over to Data Science Toolkit
        story = urllib2.urlopen('/'.join(
            [settings.DSTK_API_BASE, 'html2story']),
                                data=doc).read()

        story = json.loads(story).get('story', '')

        if strip_control_chars:
            story = strip_control_characters(story)
        return story
    except urllib2.URLError, e:
        return ''

Ejemplo n.º 3

Mostrar archivo

Archivo: feed_items_to_hdfs.py Proyecto: Bartelo/openjumo

    def fetch_url(self, line):
        issue_id, url, data = line.split('\t')
        url = url.strip('"')
        
        outfile = os.sep.join([self.outfile_base_path, hashlib.md5(''.join([issue_id, url or data])).hexdigest()]) + '.out'
        
        if url and not os.path.exists(outfile):
            new_data = super(FeedItemWebCrawler, self).fetch_url(url)
            if new_data:
                data = new_data

        if not os.path.exists(outfile):            
            with open(outfile, 'w') as f:
                    f.write('\t'.join([issue_id, strip_control_characters(data)]))    
            return 'Wrote data'
        else:
            return 'Nada'

Ejemplo n.º 4

Mostrar archivo

    def fetch_url(self, line):
        issue_id, url, data = line.split('\t')
        url = url.strip('"')

        outfile = os.sep.join([
            self.outfile_base_path,
            hashlib.md5(''.join([issue_id, url or data])).hexdigest()
        ]) + '.out'

        if url and not os.path.exists(outfile):
            new_data = super(FeedItemWebCrawler, self).fetch_url(url)
            if new_data:
                data = new_data

        if not os.path.exists(outfile):
            with open(outfile, 'w') as f:
                f.write('\t'.join([issue_id, strip_control_characters(data)]))
            return 'Wrote data'
        else:
            return 'Nada'