资源数据质量诊断的理论与方法初探——以统计型数据为例
2002-01-20分类号:TP75
【部门】中国科学院地理科学与资源研究所 中国科学院地理科学与资源研究所 中国科学院地理科学与资源研究所 北京100101 北京100101 北京100101
【摘要】随着信息化技术的发展 ,各学科越来越重视各种数据的应用 ,数据的质量问题就显得更加重要 ,数据质量的好坏直接关系到数据开发的效率和数据应用的程度。如何诊断现有数据的质量 ,是数据与信息处理领域亟待解决的问题。本文首次以资源科学研究中最常用的统计型数据为例提出了数据质量诊断的方法 ,其关键是根据各种数据序列的不同特性 ,研究其内在规律 ,确定诊断模型。然后根据诊断模型寻找不符合常规的数据点 ,对该点数据进行核实后做技术处理。该项研究为提高数据的可信度和增强数据应用程度提出了一套较为简便易行的理论方法。
【关键词】数据质量 诊断模型
【基金】中国科学院知识创新工程重要方向性项目“国家资源环境数据库建设与数据共享研究”(KZCX2 30 8 4 )资助
【所属期刊栏目】资源科学
文献传递