应用于信息检索的统计语言模型研究进展
2008-05-30分类号:G354
【部门】武汉大学信息资源研究中心 武汉大学信息资源研究中心 湖北武汉430072 湖北武汉430072
【摘要】统计语言模型作为一种自然语言处理的工具,已经被证明有能力处理大规模真实文本。而统计语言模型和IR相结合后所形成的SLM-IR模型的提出,是信息检索模型研究上的重大进展。本文介绍了统计语言模型在信息检索领域的基本模型及相关问题,重点分析了Lemur工具箱和标题语言模型的原理及模型,最后从整体上介绍了该领域的国际动态和研究进展情况。
【关键词】信息检索 统计语言模型 查询条件概率模型 主题语言模型
【基金】国家自然科学基金项目“文本集特征提取方法及应用研究”的研究成果之一,项目编号:70673070
【所属期刊栏目】情报理论与实践
文献传递