标题
  • 标题
  • 作者
  • 关键词

适用于海量数据应用的多维Hash表结构

2017-06-15分类号:TP311.12

【作者】吴泉源  彭灿  郑毅  卜俊丽  
【部门】国防科技大学计算机学院  
【摘要】传统的Hash表通过对目标数据进行Hash计算,可以实现数据的快速存取与检索。为了保持较好的存储性能,需要使整个Hash表保持疏松的状态,从而牺牲掉10%25%的空间。这对于海量数据存储而言,是一种巨大的空间浪费。该文提出一种多维Hash表结构,通过增加Hash表在逻辑上的维度,大大降低了Hash表的冲突率,实现了在较高的填充率下获得较满意的性能。实验结果表明:在千万的数据量级上,二维Hash表的冲突率比传统Hash表的减小24个数量级,总体性能则提升了1个数量级。该文还在原有填充率的基础上,提出失效率的
【关键词】多维  Hash表  海量数据存储  失效率
【基金】
【所属期刊栏目】清华大学学报(自然科学版)
文献传递