国内中文自动分词技术研究综述
2011-01-20分类号:TP391.1
【部门】华南师范大学经济管理学院 河北北方学院理学院
【摘要】认为分词是文本自动分类、信息检索、信息过滤、文献自动标引、摘要自动生成等中文信息处理的基础与关键技术之一,中文本身复杂性及语言规则的不确定性,使中文分词技术成为分词技术中的难点。全面归纳中文分词算法、歧义消除、未登录词识别、自动分词系统等研究,总结出当前中文分词面临的难点与研究热点。
【关键词】中文分词 分词算法 歧义消除 未登录词 分词系统
【基金】国家社会科学基金项目“自动文本分类技术研究”(项目编号:08CTQ003)研究成果之一
【所属期刊栏目】图书情报工作
文献传递