在当今数字化时代,企业产生了大量数据,这些数据对于计算机审计而言是宝贵的资源。审计人员在面对海量数据时,必须能够从中提取出高质量的审计证据,以便更准确地进行审计工作。数据挖掘技术为处理这一挑战提供了解决方案,通过运用数据挖掘技术,可以从大量不完全、有噪声、模糊且随机的实际应用数据中提取隐藏的、不为人知但潜在有用的信息和知识。数据挖掘技术在审计中的应用可以简化审计过程,提高效率,确保审计结果的正确性。
数据挖掘的技术应用在审计数据分析流程中主要包含以下几个步骤:
1. 审计数据采集:数据采集是计算机审计的第一步,其目的是从被审计单位的财务及业务信息系统中获取电子数据,并进行适当的格式转换。数据采集的方法主要有:利用被审单位信息系统的数据导出功能、利用通用的数据处理软件(如Access、SQL Server)完成数据采集、利用审计软件完成数据采集,以及利用专用程序接口完成数据采集。
2. 数据预处理:为提高分类的准确性、高效性和可伸缩性,必须对数据库进行预处理,包括数据清洗、相关性分析、数据转换等。数据清洗是审计数据分析的重要环节,其目的是发现和消除数据中的错误和不一致性,从而提高数据的质量。
3. 数据挖掘建模与分析:在数据预处理之后,通过设定数据挖掘参数,利用特定的算法,如DBSCAN聚类算法,对数据进行建模和分析,从而找出隐藏的、潜在有用的信息和知识,即审计证据。
4. 对审计证据评价:得到审计证据后,需要对这些证据进行评价,以确保其有效性,并将其应用于审计结论。
DBSCAN聚类算法是数据挖掘中的一种算法,可以应用于审计数据分析中查找审计证据。聚类算法能够在没有先验知识的情况下,将大量数据分组,找出数据点之间的相似性,从而发现数据中的内在结构。
在数据采集和处理过程中,审计人员还必须对数据进行检查、控制和分析,以应对被审计单位信息系统软硬件平台的异构性以及可能存在的信息隐瞒、造假等问题。计算机审计的一般过程涉及审计人员对原始数据进行数据预处理,设定数据挖掘参数,对审计证据进行评价,并最终通过数据挖掘建模分析得到结论。
为了保证审计工作的顺利进行,除了技术层面的措施之外,还需建立相应的管理措施。例如,行政事业单位可以建立奖惩制度,提高思想认识,转变管理观念,重视固定资产管理,加强对管理人员的思想教育和业务培训,并根据固定资产管理环节制定考核指标,将考核结果与年终奖金挂钩。
基于数据挖掘的审计数据分析不仅涉及技术层面的实践和应用,还包括管理层面的措施。这种综合方法不仅能够提高审计工作的效率和质量,还能够确保审计结果的公正和可靠性。随着数据挖掘技术的不断发展和应用,审计人员将能够更好地应对日益增长的数据挑战,提高审计工作的整体水平。