基于随机游走模型的排序学习方法
2017-12-25分类号:TP18
【部门】南京大学信息管理学院 江苏省数据工程与知识服务重点实验室
【摘要】【目的】通过引入随机游走模型,解决有监督排序学习中训练数据的标记信息难以获取的问题。【方法】提出一种基于重启随机游走模型的排序学习方法,通过游走模型完成训练数据的自动标注,降低排序学习对标记数据的依赖性,并在OHSUMED数据集上进行实验。【结果】当已标注样本在数据集中占比50%时,该方法能有效完成排序学习任务,与标注样本占比100%的排序学习算法相比,其排序效果明显优于Rank Net算法,略低于List Net算法。【局限】本文方法要求对每个查询单独进行随机游走,这对实际应用中多样查询下的文档标注工作
【关键词】排序学习 随机游走模型 半监督学习 ListNet
【基金】国家社会科学基金项目“社会化信息搜寻认知模型研究”(项目编号:14BTQ049);; 江苏省社会科学基金重大项目“习近平总书记构建中国特色哲学社会科学重大命题研究”(项目编号:16ZD004)的研究成果之一
【所属期刊栏目】数据分析与知识发现
文献传递