示例#1
0
 def _generate_bare_text(self, offset=150):
     bare_text = self.text[:offset]
     bare_text = clear_html_element(bare_text).replace(u"《", "").replace(u"》", "").replace("amp;","")
     bare_text = re.sub("\s", "", bare_text)
     bare_text = re.sub("http://t.cn/[a-zA-Z0-9]+", "", bare_text)
     bare_text = re.sub("http://t.co/[a-zA-Z0-9]+", "", bare_text)
     bare_text = re.sub("http://url.cn/[a-zA-Z0-9]+", "", bare_text)
     bare_text = re.sub("http://goo.gl/[a-zA-Z0-9]+", "", bare_text)
     return bare_text  
示例#2
0
 def _generate_bare_text(self, offset=140):
     bare_text = self.summary[:offset]
     bare_text = clear_html_element(bare_text).replace(u"《", "").replace(u"》", "").replace("amp;","")
     bare_text = re.sub("\s", "", bare_text)
     bare_text = re.sub("http://t.cn/[a-zA-Z0-9]+", "", bare_text)
     bare_text = re.sub("http://t.co/[a-zA-Z0-9]+", "", bare_text)
     bare_text = re.sub("http://url.cn/[a-zA-Z0-9]+", "", bare_text)
     bare_text = re.sub("http://goo.gl/[a-zA-Z0-9]+", "", bare_text)
     bare_text = re.sub("http://dou.bz/[a-zA-Z0-9]+", "", bare_text).replace(u"说:", "")
     return bare_text  
示例#3
0
文件: data.py 项目: EdwinHi/thepast
 def get_summary(self):
     return clear_html_element(self.data.get("summary", ""))[:150]
示例#4
0
 def get_summary(self):
     return clear_html_element(self.data.get("summary", ""))[:150]