コード例 #1
0
ファイル: test_regUtils.py プロジェクト: memeyun2000/Demo
 def testBirthday(self):
     list = reg.getBirthday(
         "犯罪嫌疑人王海涛,男,汉族,1978年2月10日出生,身份证号码120109197802105034,户籍地:天津市滨海新区大港太平镇六间房村。"
     )
     print(list)
     self.assertIn("1978年2月10日", list)
コード例 #2
0
    if len(_list) > 0:
        return _list[0]
    return ""


if __name__ == "__main__":
    resume_dict = {}

    dict_result = npt.analy_html(html_text, UrlUtils.parseUrl(html_url))
    arr_resume = dict_result['resume']

    arr_resume_dict = []
    for resume in arr_resume:
        resume['name'] = getPersonName(resume['text'])
        resume['alias'] = firstInStrList(RegUtils.getAliasName(resume['text']))
        resume['location'] = firstInStrList(
            RegUtils.getLocation(resume['text']))
        resume['nid'] = firstInStrList(RegUtils.getIdNbr(resume['text']))
        resume['event_descr'] = firstInStrList(
            RegUtils.getEventDescrs(resume['text']))
        resume['birthday'] = firstInStrList(
            RegUtils.getBirthday(resume['text']))
        resume['volk'] = firstInStrList(RegUtils.getVolk(resume['text']))
        resume['gender'] = firstInStrList(RegUtils.getGender(resume['text']))

        if resume['name'] != '' or resume['nid'] != '':
            arr_resume_dict.append(resume)

    arr_resume_dict = npt.clean_image_url(arr_resume_dict)
    print(arr_resume_dict)
コード例 #3
0
ファイル: main_resume.py プロジェクト: memeyun2000/Demo
if __name__ == "__main__":
    resume_dict = {}
    lines = DocxUtils.docx_to_lines("asset/resume/07.docx")
    printLines(lines)
    """
    """
    lines_kv = get_resume_kvtexts(lines)

    text = ArrayUtils.listToString(lines_kv)
    # text = "姓名: 逯长松 性别: 男 照片 出生年月: 1988年2月 民族: 汉族 照片 证件类型: 身份证 证件号码: 410928198802154254 照片 最高学历: 本科 最高学位: 学士 照片 政治面貌: 党员 婚姻状况: 未婚 照片 户口所在地: 河南省濮阳县 籍贯: 河南省濮阳县 参加工作时间: 2011年08月 最高职称: 无 移动电话:     18515061589 通讯地址: 朝阳区康营小区 开始时间 结束时间 就读院校 专业名称 学历 学位 全日制 2007年09月 2011年07月 云南大学 信息与计算科学 本科 学士 是 开始时间 结束时间 公司名称 所在部门 职位名称 起始年月 结束年月 培训课程 培训机构 培训内容 授予时间 所获荣誉 授予单位 原因 2008-12-15 校级二等奖学金 云南大学 成绩优良 英文程度: 大学英语六级 计算机水平: 计算机二级C语言 其他技能:  姓名 关系 出生日期 联系方式 单位 岗位/职务 "
    # print(text)
    resume_dict['name'] = getPersonName(text)
    resume_dict['gender'] = firstInStrList(RegUtils.getGender(text))
    resume_dict['volk'] = firstInStrList(RegUtils.getVolk(text))
    resume_dict['birthday'] = firstInStrList(RegUtils.getBirthday(text))
    resume_dict['id_nbr'] = firstInStrList(RegUtils.getIdNbr(text))
    resume_dict['edu'] = firstInStrList(RegUtils.getEducations(text))
    resume_dict['degree'] = firstInStrList(RegUtils.getDegrees(text))
    resume_dict['politics'] = firstInStrList(RegUtils.getPolitics(text))
    resume_dict['marriage'] = firstInStrList(RegUtils.getMarriage(text))
    resume_dict['register_household'] = firstInStrList(
        RegUtils.getRegisterHouseHold(text))
    resume_dict['native_household'] = firstInStrList(
        RegUtils.getNativeHouseHold(text))
    resume_dict['job_start_date'] = firstInStrList(
        RegUtils.getFirstDateInJob(text))
    resume_dict['link_address'] = firstInStrList(RegUtils.getLinkAddress(text))
    resume_dict['mobile_phone'] = firstInStrList(RegUtils.getMobilePhone(text))

    # 教育经历