文本主题识别关键技术研究综述
2017-01-05分类号:G254
【部门】中国科学技术信息研究所 中国科学院成都文献情报中心 中国科学院大学
【摘要】【目的/意义】文本主题自动识别是多种情报分析,如文献分类、检索以及领域前沿识别的基础,因此对文本主题自动识别方法的研究意义显著。【方法/过程】系统调研了当前文本主题识别的关键技术,包括主题词获取方法、知识单元的关联强度计算以及面向多元关系融合的主题分析方法及实践。【结果/结论】在总结当前文本主题识别方法的不足之处的基础上,本文提出综合全面的主题词获取方法,并在抽取范围以及语法、语义层面结合运用;在主题词关联计算中,充分利用已有语义词典和领域本体,将基于语义词典相似度和知识单元共现分析结合,并考虑主题关联的
【关键词】主题识别 文本分析 主题挖掘 语义分析 多元关系融合
【基金】中国博士后基金的研究成果之一;; 中国科学院青年创新促进会资助
【所属期刊栏目】情报科学
文献传递