标题
  • 标题
  • 作者
  • 关键词

基于主题关联挖掘的跨类型数字资源分类方法

2015-11-06分类号:G254.1

【作者】张莹  高慧颖  巴志超  
【部门】济南大学管理学院  北京理工大学管理与经济学院  武汉大学信息管理学院  
【摘要】针对当前跨类型数字资源自动分类研究中未充分利用不同类型数字资源特征之间的潜在语义关联以及无法解决跨类型数字资源分类过程中的维度灾难和特征稀疏等问题,提出一种基于主题相关性挖掘的跨类型数字资源分类方法。通过TG-LDA模型对数字资源进行语义建模,并结合开放知识库Wikipedia对建模后的共享主题空间进行语义概念的扩展,最后通过Max Ent、SVM等多种算法实现对数字资源的跨类型分类。实验表明,该方法能有效增强不同类型数字资源间的亲和性,提高不同类型数字资源间的分类性能。
【关键词】数字资源  主题挖掘  跨类型分类  分类方法
【基金】国家自然科学基金项目“基于社会网络的协作模型及推荐技术研究”的成果,项目编号:71102111
【所属期刊栏目】情报理论与实践
文献传递