基于词索引的中文全文检索关键技术及其发展方向
2007-07-15分类号:G354
【部门】华中师范大学信息管理系 华中师范大学信息管理系 副教授武汉430079 教授博士生导师武汉430079
【摘要】基于词索引的中文全文检索的研究是一个涉及到多个领域的综合性课题。汉语自动分词的精度和速度、词索引数据库的结构、词汇控制技术、检索匹配机制等是影响中文全文检索效果的关键因素。目前基于词索引的中文全文检索技术还在分词技术、网络信息标引的准确率、查全率、查准率以及查询方式上存在局限。未来的中文全文检索将最终在语义、语用、语境层次上实现智能化的信息检索。
【关键词】词索引 中文全文检索 词汇控制 汉语自动分词 词表
【基金】本文系国家社会科学基金项目“基于中文XML文档的全文检索研究”(编号04CTQ005)的研究论文。
【所属期刊栏目】中国图书馆学报
文献传递