基于混合内容线索特征的语义组块标注研究
2017-04-24分类号:TP391.1
【部门】山东理工大学科技信息研究所 中国科学院科技战略咨询研究院
【摘要】大数据时代背景下,实现科技文献深层语义理解逐渐成为情报学研究的热点话题,本文利用词频统计和共词分析方法分析了科技文献内容浅层语法特征、上下文特征和核心线索词特征,构建了混合内容线索特征集合,采用条件随机场模型,对NSF碳纳米管研究领域项目数据进行了语义组块标注实验。实验结果表明,在B-SUB、I-SUB、B-ACT、I-ACT、B-GOL、I-GOL、B-IMP7种标签标注中,增加混合内容线索特征后的精度值分别达到84.43%、89.09%、84.38%、89.87%、51.33%、50.37%、37.8
【关键词】内容线索特征 条件随机场 语义组块标注
【基金】国家社会科学基金项目“未来新兴科学研究前沿识别研究”(16BTQ083)
【所属期刊栏目】情报学报
文献传递