def _generate_bare_text(self, offset=150): bare_text = self.text[:offset] bare_text = clear_html_element(bare_text).replace(u"《", "").replace(u"》", "").replace("amp;","") bare_text = re.sub("\s", "", bare_text) bare_text = re.sub("http://t.cn/[a-zA-Z0-9]+", "", bare_text) bare_text = re.sub("http://t.co/[a-zA-Z0-9]+", "", bare_text) bare_text = re.sub("http://url.cn/[a-zA-Z0-9]+", "", bare_text) bare_text = re.sub("http://goo.gl/[a-zA-Z0-9]+", "", bare_text) return bare_text
def _generate_bare_text(self, offset=140): bare_text = self.summary[:offset] bare_text = clear_html_element(bare_text).replace(u"《", "").replace(u"》", "").replace("amp;","") bare_text = re.sub("\s", "", bare_text) bare_text = re.sub("http://t.cn/[a-zA-Z0-9]+", "", bare_text) bare_text = re.sub("http://t.co/[a-zA-Z0-9]+", "", bare_text) bare_text = re.sub("http://url.cn/[a-zA-Z0-9]+", "", bare_text) bare_text = re.sub("http://goo.gl/[a-zA-Z0-9]+", "", bare_text) bare_text = re.sub("http://dou.bz/[a-zA-Z0-9]+", "", bare_text).replace(u"说:", "") return bare_text
def get_summary(self): return clear_html_element(self.data.get("summary", ""))[:150]