基于句法依存和条件随机场的韵律短语识别
2018-12-24分类号:TP391.1
【部门】山西大学计算机与信息技术学院 山西大学计算机智能与中文信息处理教育部重点实验室
【摘要】正确划分句子的韵律结构对于提高合成语音的质量具有重要的意义。特征的选择是韵律结构预测的关键因素之一。在中文信息处理中,文本特征可以分为浅层文本特征与深层文本特征。浅层特征包括词、词性、词长等;深层特征包括句法信息、语义信息等。该文在挖掘剖析句法结构、依存句法结构同韵律结构之间关系的基础上,从文本中获取相关浅层和深层文本特征,并采用条件随机场模型实现韵律短语预测。首先以浅层文本特征进行韵律短语识别,然后在此基础上加入句法依存深层文本特征进行模型构建。实验结果表明:加入句法依存特征后,韵律短语预测精确率提高了13.3%,召回率提高了14.69%,F值提高了14.1%。
【关键词】韵律短语预测 句法依存 文本特征 条件随机场
【基金】国家自然科学基金资助项目(61573231,61673248);; 山西省自然科学基金资助项目(201601D102030)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递