近年来,企业将自身数据作为核心资产,充分挖掘数据价值、全力投入商业智能(Business Intelligence,简称:BI)系统的建设。但企业往往需要面对同一个问题:数据本身才是最大的挑战。而围绕如何管好数据的文章里,“数据管理”和“数据治理”两个词出现最多,但概念却十分模糊。
ISO国际标准化组织也对数据治理和数据管理(ISO/IEC2008)提出过两者的差异化概念。遵从ISO的定义,数据治理属于数据管理的范畴内,履行数据管理的主要职能,即数据管理确定管理过程中的总体目标和原则,数据治理则细化了决策的制定,明确相关角色、工作责任和工作流程,确保数据资产能长期有序地、可持续地得到管理,而数据管理则确保这些决策的制定与执行。
依据数据管理协会(DAMA)的定义,数据治理是针对数据资产管理的具体实践,包括授权、控制和共享的决策(计划、监控的强制执行)等,内容包括制定规定、流程、工具以及实施审计数据资产管理相关的制度等。
看似有些拗口的定义实际上明确了数据管理与数据治理是“战略”与“战术”间的关系。
数据治理的核心是为业务提供持续的、可度量的价值,目标是将数据或大数据转化为货币资产。围绕这一目标,完成数据治理的最基本概念是对各种数据的评价、质量的监督与指导、应用的设计与控制。
那么,数据治理要解决哪些问题?
· 数据多头管理,职责难以清晰界定
简单来讲,数据治理是一个组织内部的“一把手”工程。在组织机构内,只有自顶向下的结构,才能解决数据集中的问题,才能确定数据治理的全局目标,推动后续工程监督措施的落实。
· 多系统分散建设,主数据缺失
随着组织业务多元化发展,信息系统建设更新迭代,各部门或业务条线生产、使用和消费数据。多头管理格局导致数据分散在各个信息系统,而信息管理方法的更新也造成数据管理的不一致性。缺乏长远的数据规划、频繁变更数据标准,这很容易造成数据不规范、不一致、冗余、混乱,以致于无法解释。
· 顶层数据质量管理流程、体系缺乏
在数据共享与数据资产变现的动力下,越来越多的组织机构开展了自身数据治理工作,但因为商业目标的差异,相互之间缺乏一致性,反而加剧了信息孤岛间连通成本的增加。
《数据治理白皮书》明确了数据治理应分为三个方面:体制层面、管理对象层面与技术平台层面。针对金融行业来讲,金融创新下繁多的业务种类直接导致纵向行政指令性数据管理机制往往做不到全覆盖与时效性的统一。因此,从行业层面来说,应加快建立行业级的数据治理体系标准,尽快制定指导方案并监督执行,以应用新的数据治理理念推动行业数据治理总体规划。
· 数据全生命周期质量控制难度大
行业内有应用ISO9001-2015开展数据产品质量管理的案例。使用“数据即产品”的概念,将数据当作组织机构的资产和产品进行管理,采用ISO9001成熟的体系和理论管理数据产品。
但用产品质量评价体系评价“数据产品”存在几个不得不面对的难点:
——数据的收集、监视和测量活动难以同时得到及时、准确、完整的数据,难以全面、真实地反映客观事实全貌。
——数据分析流程中的数据审查和筛选很难保证数据的完整性和准确性。数据时空分析过程中的抽样方法严重影响最终的数据成品。
——数据产品评价过程需要对数据分析方法进行评价,需要非常科学的领域知识来判断是否异常,分析出异常的原因和对策。
在复杂模型中,数据产品既是“源”也是“汇”。而本身数据存在的不确定性导致数据质量难以评估。举个简单的例子,空气质量指数(AQI)方面,使用美国大使馆和环保监测中心的指数有很大差异,这种差异既取决于监控点的位置,也取决于AQI指数的计算方法。而不同的AQI将直接影响着人们出行活动的决策。
· 数据安全在管理、系统、服务过程脱节
组织机构信息安全的基础是对信息系统的分级保护,例如建立ISO27001体系信息系统等级保护。虽然27001体系要求了信息安全的原则与实施细则,强调了对操作系统层、数据库和日志系统等各系统的分级授权与操作审计等。但在数据层面,这并不能形成治理的强约束,比如在数据一致性、数据的不同敏感分级、对外服务过程中的数据商业边界没有明确的要求。
CFCA正努力推动安全的数据治理体系建设,在数据治理的体系框架、实施、审计乃至产品服务等环节,提供完整的安全生态体系与解决方案。
· 现有非结构化数据应用与安全保护难度大
在万物互联与大数据环境下,文本、语音、视频、XML等非结构化数据正变得与结构化数据一样重要。因种类、格式、版本等多变的特性,非结构化数据使用场景模糊、信息价值含量低、抽取加工难度大,有些机构尚未开展针对非结构化数据的保护工作。
总之,数据治理是评估、管理、使用、改进、监控、维护和保护组织信息的质量控制工程。CFCA将在数据治理与安全合规的行业标准建设上砥砺前行,协助企业在重要数据资产管理、保护、共享以及数据资产化过程中,规划管理方案、建全流程、实施治理、建设平台,使得企业数据可以被信任用于决策重要业务。
欢迎继续关注系列谈续集《数据治理与可信计算——CFCA数据治理系列谈之二》。
责任编辑:韩希宇
免责声明:
中国电子银行网发布的专栏、投稿以及征文相关文章,其文字、图片、视频均来源于作者投稿或转载自相关作品方;如涉及未经许可使用作品的问题,请您优先联系我们(联系邮箱:cebnet@cfca.com.cn,电话:400-880-9888),我们会第一时间核实,谢谢配合。