数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。数据仓库之父比尔在著作《Building the Data Warehouse》中提出数据仓库的特征:
1、面向主题的;
2、集成的;
3、保留历史的;
4、面向决策支持的;
5、面向全企业的;
6、最明细的数据存储;
7、数据快照式的数据获取。
数据集市和数据中台,是与数据仓库有关的两个概念。
数据集市是数据仓库的一个子集,用于从数据仓库获取相关的数据加工后提供给用户。数据集市通常面向特定的业务或者团队,如市场部门有对应的营销数据集市,运营部门有运营数据集市。
银行的数据集市包括财务、营销、风险集市等。这些集市为对应的数据系统提供数据加工,此外也为各业务部门数据分析人员提供分析集市,在数据仓库提供相关数据后,由业务人员自行进行数据探索分析。通常我们认为,银行的数据仓库体系一般包括了数据集市,数据集市其实是作为数据仓库体系的一部分。
另一个概念则是数据中台。
如今数据应用到业务场景里的需求大幅增加,需要和应用系统打通,并把数据应用于业务分析。这也要求数据仓库有数据中台的概念。但由于原来数据仓库的架构都打得很坚实,因此倘若想调整架构去支撑业务,很难从底层到顶层的完成对技术改造的工作。
同时,由于银行业组织结构异常复杂,里面数据的应用、系统的打通不是一个部门的人或一个层面的人去推进和支持可以实现的。所以说,在银行实践数据中台的时候其实都是要独立于数据仓库去做。
上图罗列了银行的业务特色。对银行来说,它们业务层面主要是交易类的,主要分为两条线,包括渠道和业务。
渠道是指银行相关的各种平台,如手机银行、 ATM 机、网上银行等,这些都是它们采集数据的重要渠道,也是它们核心业务的渠道。
业务是银行的重心,如理财、个贷等。这些跟它们自有的业务特色密切相关。
如上图所示,这是一个比较常见的数据仓库的架构。它的层级十分清晰:从数据源的采集到 ODS 那一层,再到数据应用层。最上面的那一层就是应用层,比如报表展示、即席查询、数据分析等。
如上图所示,这些是银行数仓的常见主题模型,一共是十个:当事人、资产、财务管理、区域位置、营销活动、协议、事件、内部机构、产品和渠道。
未来,银行数仓体系会如何发展?
就整体趋势而言,数据会越来越分散,这里的分散是指数据源获取的分散。随着应用多样化,数据源变多,数据量暴增,服务器资源永远都不够用。
因此银行数据领域如果真的想实现数据驱动的话,还需要走较长的路。
易观作为国内领先的数据服务公司,对数据仓库提出了自己思考:基于用户行为数据中台的解决方案。
由于银行业的复杂性,会接入非常多的数据源,因此这一解决方案主要针对上层进行整合。易观技术服务团队通过在接口层面开放权限管理和项目管理,银行工作人员便可以通过自己的管理权限界面在我们接口,保证了不同模块在权限管理层面的统一。项目同样如此。
版权声明及安全提醒:本文转自网络平台易观,文章仅代表作者观点,不代表「金融文库」立场。相关版权归原作者所有,「金融文库」仅提供免费交流与学习,相关内容与材料请勿用于商业。我们感谢每一位原创作者的辛苦付出与创作,如本转载内容涉及版权及侵权问题,请及时联系我们客服处理(微信号:JRwenku8),谢谢!