标题
  • 标题
  • 作者
  • 关键词

大规模地名本体数据库系统的建构技术与方法

2016-04-20分类号:P281

【作者】俞敬松  王惠临  杨洁  
【部门】北京大学信息管理系  北京大学软件与微电子学院  
【摘要】[目的/意义]实用的大规模地名本体数据库系统在自然语言处理、信息检索和情报分析领域具有重要的应用价值。本研究的目的是在减少人工干预的情况下,实现对地名简称、俗名以及随时间变化的复杂地名文本的自动识别与处理。[方法/过程]以多种方法获取大规模名址数据为根基,简化地名元素间复杂关系,在开发名址元素切分、属性与关系分析及推理工具包的基础上,利用Neo4j图数据库工具开发实用地名本体数据库系统。[结果/结论]基于所介绍的技术与方法而构建的系统具有良好的容错性和持续的数据更新能力,其地名分析、地名元素间关系推理达到了期望的精度,并在面向诸如新闻主题追踪、金融征信中的地名匹配等多种自然语言处理任务中取得良...
【关键词】自然语言处理地名  本体库名址  分析  关系推理
【基金】
【所属期刊栏目】图书情报工作
文献传递