Skip to content

基于法律裁判文书的事件抽取及其应用,包括了数据的预处理、分词、词性标注、命名实体识别和事件要素抽取等内容

Notifications You must be signed in to change notification settings

wt200081/Event-Extraction

 
 

Repository files navigation

基于法律裁判文书的事件抽取及其应用

简介

针对交通肇事案件的裁判文书进行事件要素抽取

  • 数据来源OpenLaw

  • 预处理:去除标点、注释、冗余词等

  • 分词:尝试了词典匹配法、隐马尔科夫模型、jieba、中科院PYNLPIR系统和哈工大LTP系统,最终选取了哈工大LTP系统

  • 词性标注、命名实体识别:使用了哈工大LTP系统

  • 事件要素抽取:目前使用了CRF模型,不久将加入LSTM等方法

  • 应用部分:在上述工作的基础上,增加一些实际应用场景。包括判决结果的预测、案件相似度的比较等

About

基于法律裁判文书的事件抽取及其应用,包括了数据的预处理、分词、词性标注、命名实体识别和事件要素抽取等内容

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 85.1%
  • Perl 14.9%