Web、语料库与双语平行语料库的建设
2013-05-20分类号:TP391.1
【部门】北京外国语大学中国外语教育研究中心
【摘要】对Web和语料库以及多语语料库的关系进行辨析,针对Web上丰富的各类电子文本,从语言工程角度出发,提出"分步骤、按领域"建设大规模双语平行语料库的思路,即选定领域专一、语言可靠、格式规范的文本,逐次建设特定领域的语料库,最后汇总成高质量、大规模、全领域的"高大全"式双语平行语料库。同时,围绕一个实例介绍如何利用Web资源建设特定领域双语平行语料库。
【关键词】Web 语料库 子语言 双语平行语料库 语言资源
【基金】教育部人文社会科学研究项目“基于语料库及对应词表的英语特异组合研究”(项目编号:09YJA740013); 国家社会科学基金项目“服务信息检索的自然语言”(项目编号:11BYY051)研究成果之一
【所属期刊栏目】图书情报工作
文献传递