标题
  • 标题
  • 作者
  • 关键词

基于互联网大数据的脱敏分析技术研究

2018-02-25分类号:TP309

【作者】周倩伊  王亚民  王闯  
【部门】西安电子科技大学经济与管理学院  
【摘要】【目的】基于现有的脱敏技术,改进匿名组的划分效果,得到较优的脱敏模型及算法。【方法】基于k-匿名技术,改进维度划分标准,以KD树作为存储结构,构造新算法。利用Python实现程序,比较所产生的匿名组数量、NCP百分比,验证算法的可行性与有效性。【结果】新算法能够使得脱敏后整个数据集所生成的匿名组个数达到最大。且NCP百分比低于同类算法。【局限】对于有某一属性离散程度显著的数据集,循环计算划分维度较为繁琐。【结论】新算法相比于传统算法增加了匿名组个数,相比于同类算法,信息损失较低。
【关键词】数据脱敏  k-匿名模型  取整划分
【基金】
【所属期刊栏目】数据分析与知识发现
文献传递