标题
  • 标题
  • 作者
  • 关键词

基于单一属性分布的数据质量评估模型

2013-06-10分类号:O211.3

【作者】徐敏  徐勇  
【部门】河海大学商学院  东南大学经济管理学院  
【摘要】文章在Parssian(2004)和Debabrata(2010)数据质量评估模型的基础上,根据"不正确、不完整、非成员"三种错误类型来研究数据质量评估。考察了属性分布函数,建立了单一标志属性下的数据质量指标之间的关系模型,且每一属性具有不同的正确率。为了验证模型的效果,进一步用模拟方法构造了一个关系表,与De babrata模型进行对比分析。结果表明,文章完善了属性值的概率分布函数,修正了Debabrata模型的假设条件,因而得到了一个更加完善的数据质量评估模型。
【关键词】数据质量  属性分布  关系模型  算例模拟
【基金】中央高校基本科研业务专项资金资助项目(2009B04414);; 江苏省社科基金项目(11GLC011)
【所属期刊栏目】统计与决策
文献传递