20210930_叶鑫_论文展示1

preview
需积分: 0 0 下载量 18 浏览量 更新于2022-08-03 收藏 906KB PDF 举报
在金融领域,欺诈检测是至关重要的任务,尤其是在财务报表审计中。这篇名为“Deep learning for detecting financial statement fraud”的论文由Patricia Craja, Alisa Kim和Stefan Lessmann共同发表于2020年的《决策支持系统》期刊上。论文的主旨在于探讨如何利用深度学习(DL)技术提升财务欺诈检测的效率和准确性。 过去的研究所关注的是各种定量的财务因素和语言特征作为识别财务异常的指标。这些特征包括语言数据(如词类频率统计、可读性分数和复杂度评分)以及词袋模型(BOW)和词性标注(POS)。然而,Hajek和Henriques的研究是少数将语言特征与财务数据相结合的尝试,并证明了这种结合可以提升欺诈检测的性能。尽管如此,尚未有研究专注于将最先进的深度学习模型应用到文本特征提取,且多数研究忽视了模型的解释性,而这一点对于审计师在客户选择和审计规划中的决策支持至关重要。 论文的主要创新点在于提出了一种名为层次注意力网络(Hierarchical Attention Network,HAN)的深度学习方法,专门用于处理年度报告的管理讨论与分析(MD&A)部分的文本数据。HAN模型能够反映出文档的结构层次,这是之前方法无法捕捉到的。此外,它在词级和句子级都采用了不同的注意力机制,可以识别出可能表明欺诈行为的“警示”句子,从而决定是否需要对特定年度报告进行进一步调查。 论文提出了三个主要研究问题: 1. 财务与文本数据(FIN+TXT)的结合是否比单独使用FIN或TXT更能提供欺诈检测的有用信息? 2. 状态-of-the-art的深度学习模型(HAN)能否在提取文本特征时超越词袋模型(BOW),并与定量财务特征结合使用? 3. 提出的深度学习模型是否有助于解析表明欺诈的文本特征,提供“警示”指标来支持决策制定? 论文通过实证研究,比较了HAN模型与传统方法的性能,以验证这些研究问题。如果HAN模型能够有效地提取文本特征并优于BOW方法,那么它将为财务欺诈检测提供一个强大且可解释的工具,这不仅能够提高检测准确性,还能为审计过程提供有价值的指导。通过这样的深度学习技术,审计师和金融专家可以更有效地识别潜在的欺诈行为,从而保护投资者的利益,维护金融市场的稳定。