大数据背景下的谷歌翻译——现状与挑战
2016-05-15分类号:F49
【部门】杭州电子科技大学经济学院 中国人民大学 中国人民大学统计学院 中国人民大学统计咨询研究中心
【摘要】在大数据时代,如何通过数据分析挖掘事物的内在规律是人们需要思考的问题。谷歌翻译基于"最好的表达为出现频率最高的表达"这样的认识,将翻译问题转化为统计问题。本文以谷歌翻译为案例,详细分析了案例背景、实现过程,并给出案例反思。谷歌翻译的成功之处在于,将实际问题巧妙地转化为统计问题,并利用其强大的计算能力解决问题。其瓶颈在于,当前的方法只利用了大数据的少量信息,不能充分刻画大数据的全部信息。谷歌翻译对问题的转化和处理方式是大数据应用的典范,对利用大数据解决实际问题有重要的借鉴意义。
【关键词】谷歌翻译 统计机器翻译 最大熵 最小误差率损失
【基金】中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目“生物医学大数据的统计方法巷砂研究”(15XN1011)的阶段性成果
【所属期刊栏目】统计研究
文献传递