标题
  • 标题
  • 作者
  • 关键词

基于关键词和支持向量机的财务大数据爬虫

2016-08-03分类号:F275

【作者】王燕嘉  
【部门】内蒙古财经大学会计学院  
【摘要】从互联网上获取信息进行分析,已经成为人们进行决策的重要手段。有效地从海量数据中获取正确的目标信息是当前的重点和难点问题。通用搜索引擎检索的结果由于主题相关性不强,无法满足特定用户的需求。文章在改进SVM参数寻优算法的基础上,提出了结合关键词过滤算法和适用于大数据分类的支持向量机算法,并利用设计的财务管理相关主题信息分类算法,构建了财务管理相关主题爬虫系统。实验结果表明,基于关键词与改进支持向量机的财务管理主题相关爬虫能有效地采集目标信息,能够较好地适用于财务管理舆情管理和财务管理危机管理等相关领域。
【关键词】大数据  主题爬虫  关键词  支持向量机  寻优算法
【基金】内蒙古自治区高校创新平台“会计信息化实验实训创新教育实验室”培育项目
【所属期刊栏目】会计之友
文献传递