基于跨语言文本分类的多语资源组织方法研究
2011-10-30分类号:TP391.1
【部门】中国科学技术信息研究所
【摘要】文章以国家图书文献中心(NSTL)的多语种科技语料为研究对象,以一部科技类的英汉双语科技词典为资源工具,提出一种英汉跨语言文本分类系统的构建方法,实验结果验证了采用本方法进行跨语言分类的可行性,也为下一阶段建立跨语言分类实用系统奠定了基础。
【关键词】文本分类 翻译词典 信息资源 算法
【基金】中国博士后科学基金项目“基于查询分类的跨语言检索查询翻译消歧技术研究”(项目编号:20090450465); 中国科学技术信息研究所2010学科建设项目“自然语言处理”(项目编号:XK2010-6);中国科学技术信息研究所2010重点工作项目“多语言信息检索与翻译研究;应用工程”(项目编号:ZD2010-3-3)的研究成果
【所属期刊栏目】情报理论与实践
文献传递