标题
  • 标题
  • 作者
  • 关键词

C-value值和unithood指标结合的中文科技术语抽取

2012-10-05分类号:TP391.1

【作者】韩红旗  安小米  
【部门】中国科学技术信息研究所  数据工程与知识工程教育部重点实验室(中国人民大学)  中国人民大学信息资源管理学院  
【摘要】研究从科技论文文本中抽取作者关键词以外的科技术语的方法。因为标引效应问题,单纯选择论文中的关键词作为候选术语会影响术语库的数量和质量,需要考虑从论文文本中抽取术语。现有的大多数术语抽取方法重视采用termhood指标,而忽视unithood指标,针对此问题,在C-value算法的基础上,提出用于生成候选术语的中文术语构词规则和测量术语内部结合强度的unithood指标,实现从论文文本中抽取中文科技术语。以信息资源管理领域的术语抽取为例对提出的方法进行验证,实验结果证明,提出的方法能够有效地抽取领域科技术语,抽取精度较高。
【关键词】术语抽取  C-value算法  unithood  科技术语
【基金】“十二五”国家科技支撑计划项目“基于STKOS的知识服务应用示范”(项目编号:2011BAH10B06); 中国人民大学明德学者科学研究基金(中央高校基本科研业务费专项资金资助)“知识工程背景下信息资源管理术语构建方法研究”项目(项目编号:10XNJ052)研究成果之一
【所属期刊栏目】图书情报工作
文献传递