标题
  • 标题
  • 作者
  • 关键词

基于子带频谱质心特征的高效音频指纹检索

2017-04-15分类号:TN912.3

【作者】孙甲松  张菁芸  杨毅  
【部门】清华大学电子工程系  
【摘要】关键音频检测是指从音频库中检索出查询样例,是音频检索的一种重要形式。该文针对传统关键音频检测方法在效率和鲁棒性上的不足分别在预处理、指纹提取以及检索部分进行了优化。在预处理阶段采用基于子带能量比的语音端点检测算法,并在窗函数选择和子带划分方法上进行了改善;在指纹提取阶段采用种子片段选取的方法,并将指纹提取方法改进为子带频谱质心法;在检索阶段通过设定命中次数门限以提高效率。实验结果表明:该文提出的改进系统在查全率、查准率以及抗噪能力提升的同时提高了检索效率,有效地提升了检索性能。
【关键词】音频信息检索  子带频谱质心特征  指纹提取  端点检测
【基金】国家自然科学基金资助项目(61105017)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递