基于法律裁判文书的事件抽取及其应用 简介 针对交通肇事案件的裁判文书进行事件要素抽取 数据来源:OpenLaw 预处理:去除标点、注释、冗余词等 分词:尝试了词典匹配法、隐马尔科夫模型、jieba、中科院PYNLPIR系统和哈工大LTP系统,最终选取了哈工大LTP系统 词性标注、命名实体识别:使用了哈工大LTP系统 事件要素抽取:目前使用了CRF模型,不久将加入LSTM等方法 应用部分:在上述工作的基础上,增加一些实际应用场景。包括判决结果的预测、案件相似度的比较等