基于关联规则的耕地质量评价数据检错方法研究——以广州市为例
2020-03-15分类号:F323.211
【部门】华南农业大学资源环境学院 华南自然资源科学技术研究院 广东省土地信息工程技术研究中心 自然资源部建设用地再开发重点实验室 广东省土地利用与整治重点实验室 美国威斯康星大学麦迪逊分校地理学系 华南农业大学数学与信息学院
【摘要】研究目的:从数据项之间关联关系的角度切入,探索一种新的耕地数据质量检错方法,以期更有效地提高耕地数据库的质量。研究方法:通过数据挖掘算法寻找耕地数据库中的关联关系,计算这些关联关系的发生频率,从中提取低频发生的关联关系作为检测规则(关联规则),最后利用这些关联规则识别耕地数据库中的错误记录(包含或符合关联规则的耕地数据记录为错误记录)。研究结果:(1)该方法有能力识别耕地数据库中的错误,可以做到有效提高耕地参评数据库的正确性;(2)经计算,与耕地领域现有的传统数据检错方法相比,同等条件下该方法可将检错效率提高11倍,甚至更多;(3)该方法可以针对不同的数据库迅速挖掘关联规则,灵活地应对不同的耕地数据库和层出不穷的错误类型。研究结论:基于关联规则的耕地数据库质量检测方法高效、便捷,为耕地领域现有的数据检错方法开辟了一个新的角度和思路,可以在地学领域广泛应用。
【关键词】耕地数据质量检测 关联规则 数据挖掘 关联关系
【基金】国家重点研发计划(2018YFD1100103,2016YFC0501801);; 青海省科技计划项目(2017-ZJ-730);; 广州市科技计划项目(201804020034)
【所属期刊栏目】中国土地科学
文献传递