基于PhraseLDA模型的主题短语挖掘方法研究
2017-04-20分类号:TP391.1
【部门】中国科学院文献情报中心 中国科学院大学 中国科学院武汉文献情报中心
【摘要】[目的/意义]以主题短语识别为研究对象,提出基于PhraseLDA模型的主题短语挖掘方法,为快速理解文本内容、准确抽取文本主题提供借鉴思路。[方法/过程]对低频词进行量化定义,提出一种合理的短语重要度计算方法,最终利用PhraseLDA主题模型推理出主题短语。[结果/结论]实验结果表明该方法在多种数据集中挖掘出的主题短语质量较高,主题一致性较强。
【关键词】主题模型 短语挖掘 主题短语
【基金】中国科学院“全院科技信息监测中心建设”项目(项目编号:院1628-4)研究成果之一
【所属期刊栏目】图书情报工作
文献传递