def main(): # 识别歧意词 text = u"龚学平、张晓辉等领导说,邓颖超生前杜绝超生" terms = segment.seg(text) print_terms(terms) # 识别人名 text = u"签约仪式前,秦光荣、李纪恒、仇和等一同会见了参加签约的企业家。" terms = segment.seg(text) print_terms(terms) # 识别地名 text = u"蓝翔给宁夏固原市彭阳县红河镇黑牛沟村捐赠了挖掘机" terms = segment.seg(text) print_terms(terms) # 识别组织名 text = u"济南杨铭宇餐饮管理有限公司是由杨先生创办的餐饮企业" terms = segment.seg(text) print_terms(terms) # 简繁转换 text = u"以后等你当上皇后,就能买草莓庆祝了" print segment.simplified_to_traditional(text) # 繁简转换 text = u"用筆記簿型電腦寫程式HelloWorld" print segment.traditional_to_simplified(text)
def test_seg_find_nr(self): text = u"签约仪式前,秦光荣、李纪恒、仇和、王春桂等一同会见了参加签约的企业家。" terms = segment.seg(text) self.assertIn((u"秦光荣", "nr", 6), terms, u"测试是否找出人名") self.assertIn((u"李纪恒", "nr", 10), terms, u"测试是否找出人名") self.assertIn((u"仇和", "nr", 14), terms, u"测试是否找出人名")
def test_seg_find_nr(self): text = u"签约仪式前,秦光荣、李纪恒、仇和、王春桂等一同会见了参加签约的企业家。" terms = segment.seg(text) self.assertIn((u"秦光荣", 'nr', 6), terms, u"测试是否找出人名") self.assertIn((u"李纪恒", 'nr', 10), terms, u"测试是否找出人名") self.assertIn((u"仇和", 'nr', 14), terms, u"测试是否找出人名")