基于条件随机场的法言法语实体自动识别模型研究
2017-10-17分类号:G254
【部门】南京农业大学信息科学技术学院 南京师范大学法学院
【摘要】【目的】法言法语实体的自动识别是实现裁判文书文本挖掘的重要的基础性工作。【方法】采用爬虫方法获取数据,人工方式进行语料标注,利用NLPIR加载法律领域词典对语料进行分词,结合法言法语的内部和外部特征构建基于条件随机场的特征模板,自动识别语料中的法言法语。【结果】融入法言法语内部和外部特征的条件随机场模型,自动识别法言法语的实验效果良好,模型的调和平均值达到90%以上。【局限】法言法语实体自动识别模型在领域的扩展上有一定的局限性。【结论】基于条件随机场对法言法语实体实现自动抽取是可行的。
【关键词】裁判文书 条件随机场模型 法言法语实体
【基金】国家社会科学基金项目“转型期公众道德需求的司法应对研究”(项目编号:13BFX006)的研究成果之一
【所属期刊栏目】数据分析与知识发现
文献传递