标题
  • 标题
  • 作者
  • 关键词

基于SVR模型的中文领域术语自动抽取研究——面向图书情报领域

2016-01-14分类号:TP391.1

【作者】蒋婷  孙建军  
【部门】南京大学信息管理学院  
【摘要】[目的/意义]术语是本体的重要组成部分,术语自动抽取是本体自动构建的基础,文章采用回归的方法对未登录词进行概率(某个数值(组合)对应的候选词集合中术语的概率)预测,获得该词可能为术语的概率。[方法/过程]文章结合语言学和统计方法,通过构建术语库提取术语抽取模板来抽取候选术语,此外,通过引入回归的方法,将术语抽取问题转化为对词语成为术语的概率的预测问题。[结果/结论]提出的方法最后通过实验验证了其有效性。
【关键词】支持向量回归机  本体构建  本体学习  术语抽取
【基金】国家社会科学基金重大招标项目“面向学科领域的网络信息资源深度聚合与服务研究”的成果,项目编号:12&ZD221
【所属期刊栏目】情报理论与实践
文献传递