融合多源网络评估数据及URL特征的钓鱼网站识别技术研究
2017-06-25分类号:TP393.092
【部门】武汉大学信息管理学院 武汉大学电子商务研究与发展中心
【摘要】【目的】充分利用多源网络评估数据和URL异常特征数据,研究提高钓鱼网站识别准确性的可行性方案。【方法】采用8种机器学习技术,对比研究网络评估数据与传统的URL异常特征数据在钓鱼网站识别中的性能,并融合两类数据研究进一步提高钓鱼网站识别准确性的可行性方案。【结果】在钓鱼网站识别中,相比于传统的URL异常特征,利用网络评估数据可以取得更好的识别效果。融合两类数据对于提高识别准确性有一定帮助。【局限】未考虑钓鱼网站与正常网站的数量存在严重的不均衡问题。【结论】充分利用多源网络评估数据和URL异常特征数据识别钓鱼
【关键词】数据挖掘 钓鱼网站识别 机器学习
【基金】国家自然科学基金面上项目“创新2.0超网络中知识流动和群集交互的协同研究”(项目编号:71373194);; 国家自然科学基金青年基金项目“基于集成学习的区间型电力负荷预测技术研究”(项目编号:71601147)的研究成果之一
【所属期刊栏目】数据分析与知识发现
文献传递