全文检索中的汉语自动分词及其歧义处理
2005-09-15分类号:TP391.3
【部门】华中师范大学信息管理系
【摘要】歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。
【关键词】全文检索 汉语自动分词 歧义处理 t-信息差 专家系统
【基金】本文是国家社会科学基金项目“基于中文XML文档的全文检索研究”(编号:04CTQ005)的研究成果。
【所属期刊栏目】中国图书馆学报
文献传递