标题
  • 标题
  • 作者
  • 关键词

基于多重过滤策略的科技文献自动标引方法研究

2012-12-30分类号:G254.36

【作者】高影繁  徐红姣  王惠临  
【部门】中国科学技术信息研究所  
【摘要】文章提出一种基于多重过滤策略的科技文献自动标引方法,该方法不依赖于大规模训练语料,很容易作为处理模块嵌入到其他文本处理环节中,实验结果验证了方法的可行性。另外,还提出了一种基于二次文献的标引词评价方法。该方法虽然严重依赖于二次文献中给出的摘要和关键词的质量,但在人力和物力资源不足以支持建立一个高质量测试集的条件下是有价值的,制定更加合理有效的评测方案势在必行。
【关键词】多重过滤  科技文献  自动标引
【基金】中国科学技术信息研究所学科建设课题“自然语言处理”(项目编号:XK2011-6); 中国科学技术信息研究所重点工作课题“多语言信息获取关键技术研究与应用示范”(项目编号:ZD2011-3-3); 中国科学技术信息研究所科研项目预研资金(项目编号:YY-201121)支持
【所属期刊栏目】情报理论与实践
文献传递