面向计算机教育资源的垂直搜索引擎系统的设计
2010-05-30分类号:TP391.3
【部门】华东交通大学信息工程学院 华东交通大学软件学院
【摘要】本文详细介绍了面向计算机教育资源的垂直搜索引擎的体系结构,重点叙述了构成垂直搜索引擎的主题爬虫的爬行策略、主题相关度算法和主题词库的设计策略。实验结果表明:软件系统中Heri-trix的最大响应时间是0.563秒,查询精度和主题相关度判别算法的精度均达到了60%以上,可以面向Web加以应用。
【关键词】计算机 教育资源 垂直搜索引擎 向量空间 模型
【基金】江西省教育厅科技项目“分布式网络机器人的软件研究”(项目编号:2006[177]); 华东交通大学校立科研基金“基于SOA架构的垂直搜索引擎的研究与实践”(项目编号:08XX05)的研究成果
【所属期刊栏目】情报理论与实践
文献传递