基于语义表示和动态主题模型的社科领域新兴主题预测研究
2022-09-08分类号:C1;G353.1
【部门】南京大学信息管理学院 江苏省数据工程与知识服务重点实验室
【摘要】[目的/意义]预测社科领域在未来有发展潜力的研究主题对于科研工作者寻找新的学科增长点和政府部门优化资源配置至关重要。文章提出一种基于语义表示和动态主题模型的社科领域新兴主题预测框架,以期丰富和完善主题预测研究的方法体系。[方法/过程]首先,使用BERT模型和UMAP算法对文本进行语义表示和向量降维,再通过动态主题模型对嵌入向量进行聚类,从而获得全局主题;其次,构建新兴主题指标计算公式,基于Neural Prophet模型和非参数检验方法预测新兴主题;最后,通过划分时间窗将全局主题细化为多个局部主题,以定位最近时间段的新兴词汇。[结果/结论]选取“人口老龄化”领域的学术论文和报纸进行实证研究,并采用资料验证法进行方法有效性分析,结果表明该方法能够快速准确地预测社科领域中的新兴主题。
【关键词】新兴主题预测 动态主题模型 BERT 时间序列模型 文献计量
【基金】南京大学新时代文科卓越研究计划“中长期研究专项”项目“‘数智赋能’背景下的情报学理论、方法与应用研究”的成果
【所属期刊栏目】情报理论与实践
文献传递