基于双向门限递归单元神经网络的维吾尔语形态切分
2017-01-15分类号:H215;TP183
【部门】清华大学计算机科学与技术系 智能技术与系统国家重点实验室 清华信息科学与技术国家实验室(筹)
【摘要】以维吾尔语为代表的低资源、形态丰富语言的信息处理对于满足"一带一路"语言互通的战略需求具有重要意义。这类语言通过组合语素来表示句法和语义关系,因而给语言处理带来严重的数据稀疏问题。该文提出基于双向门限递归单元神经网络的维吾尔语形态切分方法,将维吾尔词自动切分为语素序列,从而缓解数据稀疏问题。双向门限递归单元神经网络能够充分利用双向上下文信息进行切分消歧,并通过门限递归单元有效处理长距离依赖。实验结果表明,该方法相比主流统计方法和单向门限递归单元神经网络获得了显著的性能提升。该方法具有良好的语言无关性,能够
【关键词】双向门限递归单元 神经网络 维吾尔语 形态切分
【基金】国家自然科学基金重点项目(61331013);; 国家“八六三”高技术项目(2015AA015407)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递