从小数据到大数据——观点检索面临的三个挑战
2016-02-03分类号:G252.7
【部门】中南财经政法大学信息与安全工程学院 武汉大学信息管理学院
【摘要】随着大数据时代的到来,与同一产品或者话题相关的网络评论在不同领域、语言等方面所呈现的前所未有的分散性和多样性给观点检索带来了巨大挑战。大数据环境下的观点检索不再等同于基于大规模数据的观点检索,而是涉及如何解决规模跨度、领域跨度、语言跨度等众多问题。文章从潜在语义索引、佩奇排名、映射/规约以及SQL-onHadoop等方面对解决规模跨度问题进行了探索;从共同特征选择、目标领域文档选择、查询词扩充、迁移学习等方面对解决领域跨度问题进行了分析;从多语词典构建、语料库对齐、用户反馈和用户行为、领域知识对齐等方面对解决语言跨度问题进行了研究。致力于解决大数据环境下的观点检索的可用性问题,丰富这一领域的研...
【关键词】信息检索 观点检索 小数据 大数据
【基金】国家自然科学基金面上项目“大数据环境下基于领域知识获取与对齐的观点检索研究”(项目编号:71373286)和国家自然科学基金青年项目“Web 2.0环境下基于本体学习的观点挖掘研究”(项目编号:70903047)的成果之一; 国家留学基金资助(项目编号:201306275033)
【所属期刊栏目】情报理论与实践
文献传递