基于聚类分析的国内文本挖掘热点与趋势研究
2019-06-24分类号:TP391.1
【部门】中国矿业大学(北京)管理学院
【摘要】了解国内文本挖掘领域的研究热点和趋势,对于掌握领域内容的发展变化及促进相关研究的进一步发展具有重要意义。首先,本文以CNKI数据库中1998—2017年的1155篇文本挖掘相关主题的研究文献为样本,以文章关键词的词频矩阵为数据,利用SPSS软件对其进行聚类分析。然后采用卡方统计抽取高关联度关键词对聚类结果进行解读,根据聚类结果将文本挖掘领域的文献从宏观上划分为13类,从而把握国内文本挖掘的研究热点与趋势。分析结果表明,国内关于文本挖掘的基础研究、文本大数据预处理、文本挖掘应用领域的研究是热点,有关关联规则、文本聚类、文本分类相关的应用研究文献数量较少,未来关于文本主题分析、文本大数据预处理、网络文本挖掘的研究可能成为新的趋势。
【关键词】文本挖掘 聚类分析 研究热点 趋势
【基金】国家自然科学基金项目“基于数据挖掘的煤矿安全可视化管理模型及图元体系研究”(61471362)
【所属期刊栏目】情报学报
文献传递