标题
  • 标题
  • 作者
  • 关键词

一种基于可伸缩模式的潜在语义挖掘方法

2019-07-15分类号:TP311.13

【作者】邱镇  王琪媛  刘迪  孟洪民  
【部门】国网信息通信产业集团有限公司  国网(北京)节能设计研究院有限公司  
【摘要】大数据反映了人们的生活习惯、社会规律以及自然规律.数据流作为大数据最重要的表现形式之一,应用的范围非常广泛.在实际的数据流应用领域中,连续数据点组成的波段在宏观层次上展示了丰富的语义,因此以模式(波段)为粒度来表达数据流显得尤为重要.为此基于SP-tree挖掘的可伸缩模式,提出了Pattern2vec的方法,将可伸缩模式向量化,利用向量来发现数据流上潜在的隐含语义,完成分类工作.在医疗和电力数据开展实验,实验结果表明,Pattern2vec相比其他对比方法,具有更好的分类表现.
【关键词】大数据  可伸缩模式  向量化  隐含语义  分类
【基金】国家电网科技项目(52110418002W)资助
【所属期刊栏目】中国科学技术大学学报
文献传递