神经机器翻译系统在维吾尔语-汉语翻译中的性能对比
2017-08-15分类号:TP391.2
【部门】清华大学计算机科学与技术系智能技术与系统国家重点实验室清华信息科学与技术国家实验室(筹)
【摘要】基于深度学习的神经机器翻译已在多个语言对上显著超过传统的统计机器翻译,成为当前的主流机器翻译技术。该文从词粒度层面出发,对国际上具有影响力的6种神经机器翻译方法在维吾尔语-汉语翻译任务上进行了深入分析和比较,这6种方法分别是基于注意力机制(GroundHog),词表扩大(LV-groundhog),源语言和目标语言采用子词(subword-nmt)、字符与词混合(nmt.hybrid)、子词与字符(dl4mt-cdec)以及完全字符(dl4mt-c2c)方法。实验结果表明:源语言采用子词、目标语言采用字符
【关键词】神经机器翻译 资源匮乏语言 维吾尔语
【基金】国家自然科学基金重点项目(61331013);; 国家“八六三”高技术项目(2015AA015407)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递