基于可拓学理论的高维大数据相似性研究
2015-10-25分类号:TP311.13
【部门】北京物资学院信息学院
【摘要】高维大数据的相似性计算是数据挖掘领域的研究重点,论文通过分析高维大数据相似性计算的难点,提出采用可拓学的方法解决其中矛盾问题的研究思路。在基元表示高维大数据的基础上,借助数据转换、数据筛选、权重的确定、数据预处理等技术实现了数据之间的相似性计算,并基于水污染常规分析数据进行了算法验证。论文借助可拓的思想研究大数据相似性的问题,不仅对数据挖掘的研究有一定的理论促进,同时也为可拓学的研究提供了新的应用空间。
【关键词】大数据 高维数据 可拓学 相似性
【基金】北京市教委科技计划面上项目(KM201510037001); 智能物流系统北京市重点实验室(NO:BZ0211); 北京市属高等学校创新团队建设提升计划项目(项目号:IDHT20130517)
【所属期刊栏目】运筹与管理
文献传递