大数据审计前沿介绍
孔荫莹 吴玉怡 简 思 雷璧旗
(广东财经大学会计学院,粤港澳大湾区资本市场与审计治理研究院,广东 广州 510320)
【摘 要】随着数字经济时代的到来,人工智能、云计算、大数据等信息技术深刻影响着会计学科的发展方向,同时也给审计工作带来了新的机遇和挑战。为了紧跟时代的脚步,审计与现代信息化技术进行有机结合,由此催生了大数据审计,但人们对大数据审计却知之甚少。文章从特点、网络爬虫技术、平台构建等方面来简单地介绍大数据审计,并对大数据审计系统的构建提出了建议。
【关键词】信息化时代;大数据审计;网络爬虫技术;平台构建
【中图分类号】F239.1 【文献标识码】A 【文章编号】1008-1151(2020)01-0102-04
Introduction to the Frontier of Big Data Auditing
Abstract: With the advent of the era of digital economy, artificial intelligence, cloud computing, big data and other information technologies have have a profound impact on the development direction of accounting discipline, but also bring new opportunities and challenges to the audit work. In order to keep up with the pace of the Times, audit and modern information technology are combined organically, which has given birth to big data audit. However, people know little about big data audit. This paper briefly introduces big data audit from the aspects of features, web crawler technology and platform construction and puts forward suggestions for the construction of big data audit system.
Key words: information age; big data audit; web crawler technology; platform construction
随着信息化的迅速发展,世界各国均密切关注大数据相关问题的研究与发展,并以充分的姿态迎接新时代所带来的机遇与挑战。近年来,由于“共享经济”“智能化”“大数据”等接连涌现,部分财务人员面临着被劝退的危机,财务须转型已迫在眉睫[1]。大数据审计的出现给部分财务人员的就业带来了希望和机遇,然而人们对大数据审计的不了解也在一定程度上限制了财务的转型。
诞生。德勤曾表示,“第四张报表”是一张关注于业务数据的“数字资产表”,它通过揭示用户数据与财务之间的关系,来帮助企业将数据变现,并实现事前决策[2]。然而“第四张报表”需要强大的数据来支撑,审计也就不得不与大数据结合。国家颁布的相关文件也做出了指示,如2014年10月颁布的《国务院关于加强审计工作的意见》,提出要在审计工作中结合信息化技术。推动大数据审计,是实现审计全覆盖的必经之路。大数据审计是专业审计主体以大数据为背景,依照特定的规范,运用审计科学与大数据科学的程序与方法,对被审单位的重大财务事项、经营管理活动以及相关资料的可靠性通过大数据取证而实施的一种独立的监督活动[3]。信息技术的发展也使审计工作呈现出新的特点。最突出的表现就是,传统审计主要以“数字”为主,而现代审计则更侧重于“业务”。大数据时代使审计人员能够获取更全面的数据,而后再进行数据分析,由此大大提高了审计结论的准确度。大数据审计与传统审计的差异,如表1所示。
1 大数据审计的特点
2011年6月,世界著名咨询机构麦肯锡公司给出了大数据的定义:大数据指的是大小超出常规数据库工具获取、存储、管理和分析能力的数据集。尽管目前学术界对大数据概念的定义尚未达成一致,但是在大数据的基本特征上达成一致,即大数据具有“4 V”特征:价值稀疏(Value)、类型多样(Variety)、规模巨大(Volume)、速度快(Velocity)。大数据被认为具有多样性、高速性、规模性、价值性、真实性这几个特点,这些特点让接下来的数据采集工作有了保障。2017年,为适应数字化时代的发展需要,财务中的“第四张报表”
【收稿日期】2019-11-08
【基金项目】广东省审计厅重点科研课题“大数据技术在审计的应用”;广州市社会科学界联合会“羊城青年学人”资助研究项目(18QNXR35);广东财经大学反垄断执法与大数据分析研究中心项目(2019D04); 广东财经大学“大数据审计研究团队”和校教学成果奖培育项目“高等财经院校大数据创新性复合型人才培养的研究与实践”;广东省科技创新战略专项资金(攀登计划)“区块链技术对于票据的应用落地”。
【作者简介】孔荫莹(1979-)男,广东番禺人,广东财经大学会计学院教授,博士,研究方向为数据科学与大数据技术,大数据审计。 - 102 -
表1 传统审计与大数据审计对比表
对象 传统审计 大数据审计 改进
审计方法 财务审计 风险导向型审计
符合当时代审计需求 审计范围 抽样审计 全面审计 降低审计风险,提高审计质量 审计数据 经验审计 持续性审计 结合外部数据,提高审计连续性
与精确度
审计方式 现场审计 远程审计 降低劳动力损耗,提高工作效率 审计模式
孤立审计
协同审计
利用数据平台协同效应,实现有
效监督
2 网络爬虫技术在大数据审计上的应用
自审计诞生以来,获取被审计单位的相关数据一直都是开展审计工作的首要环节。然而随着信息化技术的不断进步,被审计单位暴露在大数据的环境下,审计方法也应与时俱进。目前的数据系统不够完善,限制了大数据审计的工作效果,由此造成了一定的审计风险。在大数据尚未发展之前,审计部门采集数据常用的方法有:被审计单位根据审计部门的要求提供数据;审计人员根据需要到被审计单位采集数据。不难发现,用传统方法采集数据时,大部分仅从被审计单位内部收集,其数据的获取范围较小,这影响了审计结果的准确性[4]。为提高审计工作效率,审计部门需要获得被审计单位外的第三方数据。所以,审计人员需要借助一些特定的软件工具,来获取网上的数据或自动采集关于被审计单位的风险信息。网络爬虫技术就可以完成这项工作,见图1。
网络爬虫技术又被称为网页蜘蛛、网络机器人等,是一种按照一定的规则,自动地抓取信息的程序脚本。如今,完成大数据审计工作需要大量数据以供参考,而用网络爬虫技术获取相关数据具有高效、便捷等优点。使用网络爬虫技术采集数据进行审计的简单步骤如下:锁定目标数据;分析网页页面结构;实现爬虫,抓取数据;对数据进行分析,以获取审计线索[5]。
在开展大数据审计工作时,利用网络爬虫技术来获取外围数据,而后将这些数据与从被审计单位获得的相关数据进行对比分析,得出相应的结论,从而更全面地了解被审计单位的实际情况[6]。这种利用网络爬虫技术的方法,不仅拓宽了采集数据的路径,而且提高了审计结果的可靠度,符合当今时代对审计的需求。
图1 网络爬虫技术在大数据审计采集数据上的应用
3 大数据审计的平台构建
近年来,我国大数据审计工作进展有序,取得了较大的进步,但是仍存在数据容量不足,缺乏对大数据处理、分析
等方面技术的问题。当务之急就是寻找大数据审计平台的构建方法,来适应新时代的需求。构建大数据审计平台涉及大数据技术、审计学、统计学和计算机等多个学科,需要运用大量的知识体系,构建过程也相当复杂。为了更好地阐述大数据审计平台,在2017年的《大数据审计平台构建研究》中,刘国城和王会金将大数据审计平台分为采集、预处理、建模分析和可视化四个子平台(见图2),并对各个子平台进行一一研究[7]。下面将对这四个子平台进行简要的概括与分析。
(1)采集平台。在任何时代下,采集数据都是进行审计工作的前提。在信息化时代,审计人员采集数据的途径也在广泛延伸,涵盖:被审计单位的内部数据;审计部门内部的数据;互联网上的各种数据;其他渠道的数据等等。审计部门可以根据需要,在特定的逻辑框架下,运用相应的技术与工具,对指定性数据进行采集,由此完成采集工作。
(2)预处理平台。对所收集的数据进行处理是审计工作的中间环节,而处理数据的得当与否,可能直接影响该项工作的正确率。处理数据时要用到审计大数据的预处理平台,它包括:数据的存储,即根据数据的结构特点选择适当的储存系统;抽取数据包括全面抽取和增量抽取两种方式,审计主体应制定适合该项工作的抽取方案;清洗运用依靠Hadoop框架的“云清洗”高效处理数据;转换与装载,即将数据转换后,保存到数据仓库。
(3)建模分析平台。由于Hadoop大数据平台的结构相对完善,并解决了在传统技术中难以处理的大数量、高并发等技术难题,且可以较快地完成对各类数据的分析,所以构建审计大数据分析平台应以Hadoop平台为基础。同时过程建模与数据挖掘技术也在推动着审计大数据分析的现代化建设。
(4)可视化平台。可视化是以图像处理、图形学、计算机设计等学科知识为基础,将审计获取的数据信息转变为图像显示出来,并实行交互分析处理。经过可视化处理的审计大数据能够以图形的形式更直观地展示数据信息,并且可以促进审计疑点的发现。
构建大数据审计平台,使得现代审计工作更符合信息化时代的需求,而且为审计工作提供了更精准、高效、便捷的审计方法。然而它仍然存在着缺陷,例如,审计数据没有统一标准,较难全面处理;大数据审计思维尚未全面普及,信息化审计工作较难在全社会范围内推广;数据库和平台的安全维护技术困难,且花费高[8]。因此,大数据审计平台还有待进一步的改进和发展。
图2 大数据审计平台的构建流程
- 103 -
4 区块链技术在大数据审计上的应用
4.1 基于区块链,大数据审计对监督、跟踪、安全
与反舞弊的技术运用
(1)监督:区块链的分布式核算、储存和去中心化,使每个节点都会同时更新交易数据和状态,且系统中的数据块由整个系统中的具有监督功能的节点来共同监督,由于每一个节点记录的都是完整的过程,因此他们都可以对审计工作全程进行监督。
(2)跟踪:区块链的加密算法、时间戳和数据自主管理,使得数据中心能对每一项已记录的审计事件、每一位审计人员进行追踪与记录。每一个区块生成时都伴随着时间戳,最终按照生成的先后顺序又生成区块链,这样就形成了一个分布式时间戳服务系统,而每一结点的时间戳都包含着上一节点的时间戳,一旦改动一个区块,就必须改动之后的所有区块,那么在审计过程中,审计人员不仅能运用时间戳来跟踪项目信息,还能防止审计证据被篡改。
(3)安全:区块链具有共识机制技术,当共识的节点越来越多时,基本上就杜绝了篡改的风险,这就使得审计过程中的每一环节都能够得到共同认定。除非区块链中的每一个节点都遭到破坏否则账目不会丢失,这样不仅能保证数据的有效性,还能保证信息的安全性;此外,还可以根据区块链的节点结构,构建数据网络安全共享机制,再采用联盟链的形式,将信息共享至各个节点,拥有相关信息的信息提供者在上传信息时,应按照一定的数据格式,加密上传至云服务器中,这样就可以有效防止数据在传输或者下载过程中被篡改。
(4)反舞弊:区块链运用非对称加密和授权技术,使得账户信息高度加密,为了保证审计独立性,有一些审计数据必须由数据拥有者授权的情况下才能看到。结合共识机制,当节点中的数据被篡改时,其他节点会很快发觉并执行其监督功能,进而能够在一定程度上防止舞弊行为的出现;此外,区块链网络中的 Merkle 树被用来归纳一个区块的所有交易信息,最终生成一个统一的哈希值,哈希值的最大特点是只能加密不能解密,于是一旦区域中任何一笔交易被改变,Merkle 树也会随之改变,进而能快速检验审计数据的完整性并降低舞弊风险。
4.2 对审计工作的影响
(1)在区块链上进行交易,或许不能提供与交易性质相关的充分、适当的证据。换言之,在区块链上记录的交易可能还有下列问题:一是没有得到授权、舞弊或非法的交易;二是在关联方之间执行的交易;三是与一项背后协议挂钩的链下交易;四是在财务报表中不正确分类的交易。进一步讲,除了上述问题,记录在财务报表中的许多交易反映了不同于历史成本的估计价值,注册会计师还需要对管理层的估计实施审计程序,即使基础性交易记录在区块链上。
(2)区块链技术的广泛采用,可能使得中央单元获取审计数据,注册会计师可以制定和实施审计程序,直接从区块链获取审计证据。然而,即使对这些交易,注册会计师还是需要考虑由于舞弊或错误导致信息不准确的风险。这将面临- 104 -
新的挑战,因为区块链可能不为被审计单位所控制。注册会计师需要从区块链提取数据,并且考虑是否可靠。这个流程可能包括考虑与区块链环境相关的一般信息技术控制。
(3)要求注册会计师了解和评估针对某区块链签署的协议的可靠性。这种评估可能需要考虑该协议是否被操纵。随着越来越多的企业探索使用私有或公共区块链,作为财务报表新的信息源,注册会计师需要考虑对审计的影响。注册会计师也需要评价管理层对数字资产和负债运用的会计政策,并考虑国际会计准则理事会对加密货币会计处理的讨论。注册会计师也需要考虑如何裁剪审计程序,来利用区块链带来的好处,以及防范伴生的风险。
4.3 区块链票据的应用
(1)研究区块链技术在票据的现状与改进。在区块链票据应用方面,首先将传统的电子票据系统与区块链票据进行对比(如表2),指出区块链票据的优势与实施的必要性;其次研究国内已有的区块链票据应用,对其不足之处提出可能的改进措施;然后研究在区块链3.0时代,尤其是在跨链技术的基础上,区块链票据能否产生质的飞跃;最后对研究进行总结,阐述区块链票据应用落地对审计、法律等方面产生的影响。
表2 传统电子票据系统与区块链票据
传统电子票据系统
区块链票据
数据完整和安全 √ √√√ 第三方费用 ¥¥¥ ¥ 文件与数据连贯性
√ √√√ 成立费用
¥¥¥ ¥ 透明度和不可篡改性
×(难以保证)
√√√ 文件规范性
√
√√√
(2)研究在大数据审计的背景下,区块链票据的应用落地对审计工作以及其法律方面的影响。尤其针对已有的“基于区块链技术的数字票据平台”与深圳市税务局联合腾讯公司开出的全国首张区块链电子发票,在增值税方面、智能合约改进方面、底层技术与共识机制的改善方面进行补充。区块链如何影响注册会计师审计以及注册会计师行业,还存在许多未知。区块链已经影响注册会计师审计的一些实体和企业,在可预见的将来,区块链技术不会取代财务报告和财务报表审计,因为区块链不可能取代注册会计师作出的判断。然而,注册会计师需要跟踪区块链技术的发展,因为它会影响信息技术系统。注册会计师需要熟悉区块链技术的基础,并同专家一起工作,以处理审计与区块链相关的复杂的技术性风险。
5 总结及建议
5.1 总结
本文在进行大数据审计和传统审计对比中发现,满足当代需求的大数据审计能够提高审计的质量、效率和连续性,通过协同效应实现有效监督。大数据审计的基础就是收集大量相关数据,网络爬虫技术收集数据的高效和便捷,可以有效收集被审计单位的第三方数据,在传统方法的基础上,达
到全面了解被审计单位实际情况的目的。在收集相关数据后,还要进一步的处理和分析,形成完整的大数据审计体系,因此可以从数据采集、预处理、建模分析和可视化四个子平台来构建大数据审计平台。
5.2.4 宣传大数据审计思维
大数据审计不仅仅是一种技术,更是一种创新的审计思维。审计人员利用这种思维,达到全面审计的目的,从而提高审计的质量和效率。要加强大数据审计的思维的宣传力度,提高大数据环境下审计全面覆盖的影响力。
5.2 建议
5.2.1 统一审计数据标准
行业之间以及企业之间业务范围和财务信息等数据具有差异,使得审计数据各具特色。为便于大数据审计平台的管理,实现审计全覆盖,应该完善审计制度体系。具体而言,设置统一的审计数据标准,规范数据、统一接口;规范大数据审计工作;建立符合国情且系统化的制度体系。 5.2.2 加强平台安全维护
由于大数据平台的构建,数据库中将会包含大量的机密信息,为防止此类信息的泄露,需要加强大数据审计平台的安全保护模块,具体可以从三个方面来落实:设置登录系统对用户身份进行验证;阻挡黑客的网络病毒攻击;加密数据库。提高大数据平台的安全性和稳定性,有助于大数据审计的推广。
5.2.3 培养大数据审计人才
传统审计人才要具备会计和审计的知识,大数据审计人才在此基础上还要具备一定的信息技术,要加强培养审计和信息技术复合型人才。
【参考文献】
[1] Manyika J, Chui M, Brown B, et al. Big data: The next
frontier for innovation, competition, and productivity [EB/OL]. https://www.mckinsey.com/ business-functions/ mckinsey-digital/our-insights/big-data-the-next-frontier-for-innovation, 2019-09-25. [2] 德勤. 德勤“第四张报表”,数字化时代下企业的价值画
像[EB/OL]. https://www2.deloitte.com/cn/zh/pages/risk/ articles/deloitte-4th-report-release-conference.html, 2017- 12-18.
[3] 杨凯茜. 浅谈大数据审计的特点及实现——以审计署对
2012年中石油的审计结果为例[J]. 财经界(学术版),2015(18): 315-316.
[4] 陈伟,Wally S. 大数据环境下的电子数据审计:机遇、
挑战与方法[J]. 计算机科学,2016,43(1): 14-19,40. [5] 张露. 网络爬虫技术在大数据审计中的应用[J]. 合作经
济与科技,2019,606(7): 192-194.
[6] 陈伟,孙梦蝶. 基于网络爬虫技术的大数据审计方法研
究[J]. 中国注册会计师,2018(7): 78-82.
[7] 刘国城,王会金. 大数据审计平台构建研究[J]. 审计研
究,2017(6): 38-43.
[8] 魏祥健. 大数据推动审计技术革新与流程再造[J]. 商业
会计,2019,651(3): 29-32.
(上接第98页)
的广东省智能电梯安装与调试的赛场外交流,最终成为深度合作企业。
专业健康的发展。
4 结语
2018年4月份,中国高等教育学会发布了《全国普通高校大学生竞赛白皮书(2012—2017)》,基于大数据全面梳理了我国高校学科竞赛发展的脉络和现状,指出10年间高校竞赛项目数量突飞猛进,教育部、财政部发文批准大学生竞赛资助项目就有19个大项,技能竞赛在高校中的影响越来越大,各学校也把参加技能竞赛视作促进教学改革重要途径[4]。笔者期望今后不断优化组织管理模式,全面总结参赛经验,积极推进资源整合,将赛项成果转化为有效教学资源,更好促进
【参考文献】
[1] 马鞍山幼儿师范学校.教育部等37部门关于印发《全国
职业院校技能大赛章程》的通知[EB/OL].http://www. ahmasys.cn/Article_Show.asp?ArticleID=3354,2018-05-22. [2] 林静,刘美,李新超.以技能大赛促进高职电气自动化专
业教学改革的探索[J]. 中国电力教育(下),2014(6): 32-33.
[3] 许振珊,李陆星,庄竞.高职院校技能竞赛促进教学改革
实证研究[J]. 教育现代化,2018,5(30): 92-93,101. [4] 张舟,黄梦婷. 关于高职院校“赛教融合”的几点思考[J].
职业教育,2017,3(22): 208,212.
- 105 -
因篇幅问题不能全部显示,请点此查看更多更全内容