基于K近邻分类算法的涉恐信息过滤模型研究
2018-03-18分类号:TP391.1
【部门】南京工业大学安全科学与工程学院 湖北工业大学信息技术中心
【摘要】[目的/意义]针对现有的涉恐信息过滤在语义过滤和主题无关性方面还存在一定的不足,建立了基于K近邻分类算法的涉恐信息过滤模型。[方法/过程]通过采用K近邻分类算法、TF-IDF分词系统和语义相似度计算建立了一种新的涉恐信息过滤模型,并从爬取主题的一次过滤到关键词匹配的二次过滤,最终进行语义分析的三次过滤,构建了一套完整的涉恐信息过滤体系。[结果/结论]本模型能够快速高效地获取涉恐信息,克服了语义和主题无关性等因素的干扰,较于传统的涉恐信息过滤在查全率和查准率上面有了很大的提升。
【关键词】涉恐信息 信息过滤 K近邻算法 分词系统 语义相似度
【基金】
【所属期刊栏目】情报杂志
文献传递