一种新的关联规则抽样算法
2007-06-15分类号:TP301.6
【部门】中国农业大学理学院 中国农业大学理学院 中国农业大学理学院 北京100083 北京100083 北京100083
【摘要】针对目前经典的关联规则挖掘Apriori算法需对数据库多次扫描费时多计算量大,而抽样扫描会造成挖掘精确度下降等问题,采用控制样本频繁项目集的方法,利用频繁1项集进行抽样处理,对关联规则挖掘的抽样操作和精度控制进行研究,提出了基于抽样操作的关联规则挖掘算法——HAC算法。理论分析及性能试验结果表明:HAC算法能够有效缩减数据库规模,至少少扫描数据库1次,提高了关联规则挖掘的效率,同时其计算精度不受影响。
【关键词】关联规则 抽样 准则系数 Apriori算法 HAC算法
【基金】国家自然科学基金资助项目(1037113160573158)
【所属期刊栏目】中国农业大学学报
文献传递