基于改进HLDA的前沿主题挖掘方法研究
2022-07-01分类号:TP391.1;G353.1
【部门】军事科学院军事科学信息研究中心
【摘要】[目的/意义] 识别和把握研究前沿具有现实价值,目前基础性知识工具中,主题模型因其独特的优越性而具有较为广泛的应用,为专家研判提供了辅助和支撑。[方法/过程]本文针对LDA的拓展模型HLDA展开研究,在方法核心过程nCRP中引入了文本相似度因子,并构造了数据集用于实证研究。[结果/结论]实验证明改进HLDA相较原始HLDA方法有了较大提升,并在不同程度上超越了现有的多种主题方法和引用网络方法,运用在前沿主题识别中具有较高准确性与可靠性。
【关键词】层次隐含狄里克雷分配 研究前沿 主题挖掘 自然语言处理 文本聚类
【基金】
【所属期刊栏目】情报理论与实践
文献传递