Lucene全文检索的应用及检索效率测试研究
2009-08-15分类号:G252.7;G250.7
【部门】武汉大学信息资源研究中心 武汉大学信息管理学院
【摘要】第一部分设计全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块。第二部分着重分析PDF数据转换,XML文档设计,索引的分词、建立及效率等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子进行测试,在此基础上设计全文检索系统并对检索响应时间进行测试。在结论中指出应关注XML数据库的安全性。
【关键词】Lucence XML 全文检索 效率
【基金】
【所属期刊栏目】图书馆杂志
文献传递