标题
  • 标题
  • 作者
  • 关键词

一种新的关联规则抽样算法

2007-06-15分类号:TP301.6

【作者】秦如新  陈静  冯一宁  
【部门】中国农业大学理学院  中国农业大学理学院  中国农业大学理学院 北京100083  北京100083  北京100083
【摘要】针对目前经典的关联规则挖掘Apriori算法需对数据库多次扫描费时多计算量大,而抽样扫描会造成挖掘精确度下降等问题,采用控制样本频繁项目集的方法,利用频繁1项集进行抽样处理,对关联规则挖掘的抽样操作和精度控制进行研究,提出了基于抽样操作的关联规则挖掘算法——HAC算法。理论分析及性能试验结果表明:HAC算法能够有效缩减数据库规模,至少少扫描数据库1次,提高了关联规则挖掘的效率,同时其计算精度不受影响。
【关键词】关联规则  抽样  准则系数  Apriori算法  HAC算法
【基金】国家自然科学基金资助项目(1037113160573158)
【所属期刊栏目】中国农业大学学报
文献传递