基于用户自然标注的TF-IDF辅助标引算法及实证研究
2018-01-08分类号:暂无
【部门】中国科学技术信息研究所
【摘要】[目的/意义]从用户角度出发,研究基于用户自然标注的TF?IDF辅助标引算法。[方法/过程]首先以核心期刊论文中作者标注的关键词和分类号为源数据,通过对关键词词频进行统计,使用TF?IDF算法构建用户标注词表、形成标引知识库,然后通过IKAnalyzer分词软件对待标引的科技项目数据进行切词和停用词处理,进而使用TF?IDF算法和位置加权算法提取科技项目数据的特征词,最终实现对科技项目数据进行关键词和分类的同步标引。[结果 /结论]实验结果表明,机标关键词与人标关键词的相似比在60%以上的科技项目数据占总
【关键词】辅助标引 用户自然标注 TF?IDF算法 信息组织
【基金】
【所属期刊栏目】图书情报工作
文献传递