标题
  • 标题
  • 作者
  • 关键词

基于用户自然标注的TF-IDF辅助标引算法及实证研究

2018-01-08分类号:暂无

【作者】陈白雪  宋培彦  
【部门】中国科学技术信息研究所  
【摘要】[目的/意义]从用户角度出发,研究基于用户自然标注的TF?IDF辅助标引算法。[方法/过程]首先以核心期刊论文中作者标注的关键词和分类号为源数据,通过对关键词词频进行统计,使用TF?IDF算法构建用户标注词表、形成标引知识库,然后通过IKAnalyzer分词软件对待标引的科技项目数据进行切词和停用词处理,进而使用TF?IDF算法和位置加权算法提取科技项目数据的特征词,最终实现对科技项目数据进行关键词和分类的同步标引。[结果 /结论]实验结果表明,机标关键词与人标关键词的相似比在60%以上的科技项目数据占总
【关键词】辅助标引  用户自然标注  TF?IDF算法  信息组织
【基金】
【所属期刊栏目】图书情报工作
文献传递