大数据下基于改进K-means聚类算法的税收风险识别
2019-11-07分类号:TP311.13;F812.42;F299.233.42
【部门】重庆理工大学会计学院 重庆市渝北区税务局
【摘要】目前的税收风险管控模型通常是基于税务人员的先验知识构建的,在海量数据环境下模型的实用性、可扩展性和精确性都有较大的局限。为解决这一问题,提出改进的K-means聚类算法。该方法是无监督学习模型,可以在无先验知识的前提下构建指标,快速且精确地对实例进行聚类,将出现明显异常的小类识别为异常,判定其存在税收风险。基于该模型对房地产类企业股权转让中的税收风险进行分析和评估,发现税收风险等级高的企业及其风险疑点,验证了本方法的有效性。
【关键词】税收风险 K-means聚类算法 大数据 股权转让
【基金】重庆市教育委员会科学技术项目“大数据背景下考虑行为‘画像’的纳税信用等级动态评估模型研究”(项目编号:KJQN201801103);; 重庆市社会科学规划项目“高质量发展下基于大数据的税收政策实施智能化支持机制研究”(项目编号:2018BS68)
【所属期刊栏目】财会月刊
文献传递