基于语音识别的农产品价格信息采集方法
2015-01-31分类号:TN912.34
【部门】中国农业科学院农业信息研究所/农业部农业信息服务技术重点实验室 青岛农业大学动漫与传媒学院
【摘要】【目的】将语音识别技术应用到农产品价格信息采集中,面向非特定人和限定词汇量的汉语普通话连续语音识别,提出一种适合于农产品价格采集环境的语音识别鲁棒性方法;以隐马尔科夫模型为基础,训练出适合该环境下的声学模型,以缓解因测试环境和训练环境不匹配而导致的识别率降低,进一步提高识别率。【方法】在数据采集和处理阶段,首先根据要识别的限定词汇按照一定的语法规则构建转换文法,利用该文法生成的脚本指导训练集和测试集录音;然后选择不同的农产品价格采集环境和不同的说话人进行语音采集,并进行准确的人工切分,最后构建出语音语料库;在模型训练阶段,选择自左向右无跳转结构的连续混合密度隐马尔科夫模型,对训练集中的数据提取...
【关键词】语音识别 农产品价格 信息采集 倒谱均值方差归一化(CMVN) 决策树聚类
【基金】国家自然科学基金项目(61271364)
【所属期刊栏目】中国农业科学
文献传递