标题
  • 标题
  • 作者
  • 关键词

基于非平衡MD&A文本数据的财务欺诈识别

2024-01-25分类号:F275;F831.51

【作者】程双双   谷晓燕   王兴芬
【部门】北京信息科技大学信息管理学院  
【摘要】财务欺诈不仅会导致会计信息失真,还会危害经济的健康发展。因此,找到一种高效的智能化欺诈识别方法具有重要的现实意义。本文基于2020—2022年美国上市公司提交到EDGAR数据库的年度报告,聚焦于报告中管理层讨论与分析部分的文本信息(Management Discussion and Analysis,MD&A)并对其进行分析。考虑到现有数据中欺诈和非欺诈样本数据极度不平衡的特点,本文在分层注意力网络的基础上设计了一个更高效的财务欺诈识别模型,最终使得欺诈识别模型的F1分数和F2分数分别提高了4.1%和3.7%,所提出的算法框架能够有效提高非平衡MD&A文本数据集的分类正确率。研究结果为财务欺诈识别系统性能的提高以及其他领域长文本分类任务的预测提供了新的解决思路,并进一步验证了使用MD&A文本数据进行财务欺诈识别的有效性,为使用非平衡数据进行欺诈识别提供了直接的实证支持。
【关键词】财务欺诈识别  管理层讨论与分析  分层注意力网络  非平衡文本数据
【基金】国家自然科学基金“复杂产品系统研发过程风险累积的网络演算度量方法研究”(项目编号:71701020)
【所属期刊栏目】管理现代化
文献传递