搜索引擎中信息存储结构的改进
2001-10-24分类号:G354
【部门】上海交通大学计算机科学与工程系 上海交通大学计算机科学与工程系 上海200030 上海200030
【摘要】网络已经成为世界上最大的数字图书馆。目前网上信息数量仍在急剧膨胀 ,无用信息所占比例愈来愈大 ,而且网络传输速度较慢 ,由于数据的存储结构直接影响着查询质量和查询速度 ,因此网络信息的存储方式亟需改进。本文针对网络信息固有的特点提出一种新的文档存储结构 ,改进了搜索引擎的性能。主要内容包括信息的自动分类 ,网页相关度的计算 ,垃圾信息以及重复信息的过滤等技术
【关键词】信息存储 智能代理 信息过滤 文本分析
【基金】国家“8 63”计划资助 (项目编号:863 30 6 ZD0 3 0 4 1)
【所属期刊栏目】情报学报
文献传递

