《“十四五”国家审计工作发展规划》强调,加强审计信息化建设和审计技术方法创新,增强大数据审计能力,充分运用现代信息技术开展审计,提高审计质量和效率。“十四五”规划以来,审计全覆盖工作不断推进,国家审计作为宏观管理和经济监督部门职能不断强化。同时伴随大数据、人工智能等信息技术的出现,大数据审计在国家审计工作中参与度慢慢的升高、作用慢慢的变大,这既是实现审计全覆盖的必由之路,也是社会信息化程度提高的必然结果。
随着大数据时代的到来以及大数据技术的发展,大数据审计是成为一种全新的数字化审计方式。审计人员通过收集数据资源,并运用数据整合的思维和方法,进行广泛而多维的关联分析,以验证被审计单位经济活动的真实性、合法性、合规性及效益性。
大数据审计的发展可以划分为以下几个阶段。首先是信息化审计初级阶段,主要运用SQL和Oracle 技术处理结构化数据,通过改进查询工具以提高审计效率。第二个阶段是大数据式审计的深化阶段,以适应PB 级别数据处理需求,采用网络爬虫技术、OCR技术、传感器采集等技术处理 HTML 等形式的半结构化和部分非结构化数据。在此阶段,主要是通过大数据技术揭示问题。第三个阶段是实现“云审计”“智能审计”的大数据审计阶段,这一阶段依赖 “云计算”和“云存储”构建数据的采集、转换和存储系统,实现高度智能化、模型化的数据分析,同时确保访问安全,以及智能化的分析平台和畅通的共享机制。
当前,各级审计机关多年来在审计署的全面统筹和领导部署下,对大数据审计工作日益重视,能坚决贯彻科技强审战略,按照审计全覆盖、“两统筹”等工作要求,不断强化大数据审计理念。基于金审工程建设,持续加强网络信息系统平台建设,致力于完善制度机制保障,培养高素质专业化团队,健全大数据审计资源体系,创新新时代审计工作方式,积极推动数据分析的广度和深度,深化新兴技术在审计全流程的应用,持续提升审计工作质效,以更好地履行审计监督职责并提高有力支持。
随着国家大数据战略的推进,政府和企业的信息化水准不断提高,导致审计项目的规模和复杂程度明显地增加,审计风险也随之上升。然后,不少审计机关仍采用传统的审计分工、行业审计划分、以及传统审计流程、取证方式和审计技术,这与信息化发展不相符,存在着不适应的问题。审计机关亟需进行理念和模式的创新,以应对跨地区、跨行业和跨领域审计的需求。当前,跨界思维方法的运用有限,局限于传统行业审计范围内,未能打破行业界限。大数据审计提倡融入审计全流程理念,但目前主要限于审计项目的初期分析。在计划定制、现场取证、成果提炼和报告生成等方面,尚未充分的发挥数据挖掘等技术力量的潜力,现场与非现场审计的互动仍处于早期阶段,疑点核查的反馈机制、举一反三机制不够健全,对于疑点问题原因的全面分类分析还有待提升,实时动态管理上的水准亦较弱。建立以数据管理部门为核心的常态化数据分析机制尚处于探索阶段。
面对被审计单位庞大的数据量,一些审计机关缺乏有明确的目的性的方法来有效利用这一些数据。部分审计机关存储了质量较差且价值有限的数据,造成了资源的浪费。此外,在数据采集和处理技术上,许多省(市)数据中心数据容量和相应的处理技术尚未达到大数据水平。他们仍主要使用 SQL和 Oracle技术来处理数据,无法满足 PB级别以上的数据处理需求,智能化和自动化技术的应用也相对有限,难以迅速支持多元异构数据的处理。半结构化和非结构化数据的采集、处理和存储方面,审计专业方面技术和工具仍然匮乏。整合各级审计机关的信息资源,深度挖掘审计业务需求,实现各级审计机关之间的业务数据协同分析和信息共享网络相互连通仍有待完善。同时,部分市县审计机关还存在数据存储环境未达安全保护要求、数据管控不严格等多方面安全风险隐患,通过等级保护测评的单位还比较少,数据分析安全环境存在改进的迫切需求。
目前,审计数据分析与大数据技术的融合程度不够深入,分析思路有限,用信息化手段解决审计问题的路径尚未建立体系。数据分析仍主要依赖审计专员对财政、金融、社保、扶贫等领域的熟悉。不一样的行业审计仍然是各自独立的,数据分割明显,缺乏围绕党政中心工作、社会热点问题的全域分析能力,没办法实现独立于审计项目的全面数据分析。流行的、能助力审计工作的新技术和方法,如图数据库、Python语言和数据挖掘等,在实际数据分析中缺乏充分的应用。预警指标和模型也有待改进,审计特有的指标和模型相对缺乏,对新型审计业务领域,如党政领导人员经责评价、政策实施效果评估和投资项目全周期分析等,应用仍有限。宏观经济数据等多领域的总和运用不足,金融等行业数据与政府财政预算、宏观经济数据、财务数据及企业社保数据等领域数据的关联分析不够深入。在数据环境相互割裂的情况下,这一些数据未能充分的利用金融审计的优势,不利于审计思路和成果的创新。
尽管金审工程在各级审计机关的推进下加强了审计信息化硬件设施,然后,在适应日益常态化、流程化和智能化的大数据审计特征方面,一些审计制度规则和信息化人才教育培训机制仍显不足。现行的审计法律和法规与当前大数据审计的变革不完全相符,需要突破一些制度障碍。例如,审计部门可获取的数据范围相对有限,规范不够明确,数据采集的强制力不足,而且缺乏全国大数据审计工作的指导性文件。在辅助审计计划的制定、审计技术标准的制定、数据质量检验、数据取证审理方式、数据分析模型评估以及大数据审计报告编制等方面,仍缺乏明确的规范指南和实质性的测试评价方法。
大数据审计是一项跨学科工作,但过去的审计信息化培训内容相对固定,方法不够灵活,未最大限度地考虑地区间的发展不平衡。特别是对于少数民族地区和整体信息化水平较低的地区,尚未提供有明确的目的性的培训,缺乏分类指导。同时,大数据审计需要多方面技能的综合人才,但招聘和培养这样的复合型人才存在一定难度,尤其是在基层审计机关。即使是多年培训出来的计算机中级审计人员,由于数据资源受限、工作业务繁重等原因,也难以将所学应用到实践中,许多人仍然处于各自为战的状态,缺乏进一步提升信息化技能的机会。
近年来,党和国家通过制度的顶层设计不断为审计事业创造有利的发展环境,丰富了审计在国家监督管理体系中的及其重要的作用,也赋予审计监督更重要的职能定位和更高的时代要求。审计机关作为政治机关和宏观管理部门,应紧密围绕推进国家治理体系和治理能力现代化的推进,坚定走科技强审之路,认真履行常态化“经济体检”职责,构建与审计职能相匹配的大数据审计理念,重点突出大数据审计在“查病”、“治已病”和“防未病”方面的支持作用。
随着大数据审计在审计业务工作中的广泛应用,2014 年审计署开始在全国推广“总体分析、发现疑点、分散核查系统研究”的数字化模式,将数据视为替代审计经验的强有力工具。在数据中审计的背景下,信息海量扩展,技术方法升级,因此就需要转变审计思维模式以适应新的审计业务组织方式。
大数据审计以数据和共享互联为特征,需要对内部合外部资源进行重组和高度统筹。一些省份已将数据采集和数据分析作为常规工作进行,将数据分析、整理和挖掘作为服务宏观决策的先决条件,并纳入年度审计项目计划的制定和审计工作方案的组建。数据分析团队需要把握宏观情况,强调核心问题,与实地审计紧密结合。此外,应完善大数据审计要素保障。建立数据驱动和综合研判机制,使数据分析成为审计全流程的基础,以现场审计和非现场审计相结合,多角度的调查和研究为补充的常态化和全覆盖式的数据分析工作机制。
此外,各级审计机关还应建立学习分享机制,通过搭建交流平台、调研学习、推举优秀审计成果以及建立大数据审计智库等多种形式进行。
大数据审计流程与关键技术的融合,具体体现在在数据采集、数据处理、数据分析挖掘和结果评价等业务环节。
在数据采集环节,要实现多样化的数据采集格式、方法和手段手段,包括原始数据上传、联网收集和定期报送等多种方式。例如,在资产环境审计中,能够使用无人机航拍、水下声呐探测系统、GPS 定位系统等技术方法。同时,要建立明确的的数据收集、传输、分析和授权规范,以加强数据安全管理。
在数据处理环节,需要加强对于非结构化数据的预处理,包括数据清洗、脚本标准化和结构化数据的转化。例如,能够正常的使用应用机器学习算法,开发与Python语言为媒介的程序,以追踪商业银行对公流水数据。
在数据分析挖掘环节,审计数据分析方法可分为常规方法、数据挖掘方法和新技术方法三类。第一类主要为统计、查询、趋势变化分析、比率分析等传统方法;第二类主要有回归分析、聚类分析、管理分析等;第三类则是利用大数据新技术的文本挖掘分析方法、知识图谱等可视化分析方法等。审计数据分析技术的应用需要涵盖数据库、地理信息技术、OCR(扫描和光学字符识别)、云计算和区块链等技术。大数据审计需要对不同部门和领域的数据来进行分析和对比,以制定判断和建立模型。因此,审计机关需要具备各类相关专业人才储备,如土木专业相关知识、地理专业相关知识、环境相关专业相关知识等。
在数据分析结果评价环节,要建立大数据审计的工作流程,通过日常的数据整理和收集、挖掘分析,制定年度审计计划,组建分析团队,集中分析,发现疑点,分类核实。其中,一个简单而直观的数据挖掘质量评价方式是疑点的价值数量与疑点发现数量之比,即:价值疑点数量/疑点发现数量的比率。