来源 | 中国金融电脑
作者 | 华为技术有限公司中国政企金融数据中心总监 陈健
随着“新基建”浪潮的不断推进,金融行业的数字化转型已成必然趋势。在此背景下,作为承载数据和计算的传统金融数据中心面临能耗高、可靠性和安全性以及运维复杂等巨大挑战,亟待变革。
近年来,金融行业实施金融科技战略,利用科技赋能运营转型与商业模式创新,实现渠道、产品服务、客户体验等全方位的数字化转型。尤其是随着人工智能、物联网、大数据、云等技术和应用的深入发展,人们对金融服务的需求更加多元化,愈发聚焦在数字渠道。与此同时,随着“新基建”浪潮的不断推进,金融行业的数字化转型已成必然趋势。在此背景下,作为承载数据和计算的传统金融数据中心面临能耗高、可靠性和安全性以及运维复杂等巨大挑战,亟待变革。
从传统电子银行时代,数据中心1.0作为支撑系统;到网络、移动银行时代,数据中心2.0的快速交付,一“建”定终生的模式;再到数字智能银行时代,数据中心应该怎么演进?未来演进的方向是什么?对此,我们在行业上和技术上提出了面向未来数据中心演进方向的十大趋势,包括五大行业趋势和五大技术趋势。
趋势一:高密成为新常态,未来3~5年,8+kW/柜成为主流
随着IT算力持续演进,CPU和服务器功率持续提升。以业内典型2路服务器功率演进为例,2014年还是180W,等到2019年已经达到500~800W,同时金融AI技术也在不断加速落地,AI算力比重也将进一步提升,必然要带来单机柜功率密度持续上升,未来3~5年,8+kW/柜将会成为主流。
趋势二:弹性架构,1代基础设施匹配2到3代IT功率演进
数据中心基础设施产品需具备全模块化的架构,才能够支撑IT的演进。从供配备电都需要模块化,如模块化UPS、模块化锂电、模块化配电等。目前业内IT设备基本上每3~5年更替一轮,功率密度5年翻番,而且IT演进速度存在差异,不同密度将共存。因此,在数据中心1代建设时,一定要未雨绸缪,匹配未来功率升级并满足高密度混合部署需求。
趋势三:低碳、绿色、环保,降低TCO,践行社会责任
一是低碳。碳足迹贯穿数据中心生命周期,2018年中国数据中心CO2排量约为49万公顷森林1年转化量;
二是绿色。当前全球数据中心的电力消耗约占总电力使用量的3%。预计未来5年,复合增长率为6%;
三是环保。在数据中心的全生命周期内应最大限度地节约资源(节能、节地、节水、节材等),保护环境和减少污染。
针对上述三点,数据中心需要从规划、设计、建设、运维全生命周期考虑如何做到最优的环境友好性,实现PUE进入1.2区间。
伴随着业务端驱动,数据中心由原来传统的以支撑为主转向生产系统,数据中心基础设施的建设周期是否可以像“火神山”“雷神山”一样快?业内普遍认为标准化和模块化是基础。通过模块化和标准化,可极大缩短建设时间,同时也降低了对施工人员的素质和数量的要求。
趋势五:“全数字化+AI智能”,数据中心向无人驾驶方向演进
如今,海量运维数据爆发式增长,依靠人工无法实现可靠性保障和最优效率,同时运维人才持续紧张,每年新增需求超15%;随着数据、算力、算法得到长足进步,AI在数据中心的AI节能(降低PUE)、AI运维(无人巡检、预测性维护)、AI运营(最优资源利用率)方面的应用不断落地,再像以前一样依赖人的运维和优化已经不可能了。因此,数据中心应从设计阶段开始考虑“数字化”并贯穿生命周期始终,基于数字化的AI使能,最大化数据中心价值。
趋势六:全模块化,并行部署,降TTM,支持IT弹性演进
快速部署和弹性扩容正驱动数据中心基础设施走向全模块化,在供电链路上,从模块化UPS,模块化锂电等向电力模块演进,在制冷链路上,冷机,水泵和阀门等组成制冷模块。这些模块融合后组成机房模块化,这些从部件模块化到架构模块化,再到机房模块化、全模块化DC,实现模块预制、预安装、预调试,到现场后,仅需简单的吊装和拼装等即可完成数据中心基础设施部署,实现支持IT功率弹性演进,同时也降低了建设过程中的不确定性,实现极简交付,极大地减少了交付时间。
传统供电方案整个链路存在多级AC/DC等功率变换,在每次变换时,都会带来损耗、成本等,未来的供电链路发展方向将减少AC/DC等变换次数,缩短供电距离,减少站点,提供极简的供电架构,并带来系统端到端成本、占地、效率的优势。
传统数据中心里,铅酸电池占地大,承重要求高,火灾频发,维护困难,寿命短。而锂电池体积小,重量轻,充电速度快,寿命长,生命周期内TCO更低。锂电池有多种类型,其中以磷酸铁锂材质最稳定,在发生热失效时,磷酸铁锂的失效温度在480度,同时不产生氧气。而其他的锂电池的失效温度基本上在180度,同时产生助燃氧气。实验证明,磷酸铁锂在做针刺穿刺时不会起火,而像锰酸锂等在做针刺实验时会起明火。所以数据中心应首选磷酸铁锂材质。除了在选材上要注意外,还需要注重BMS的管理,要做好均衡管理、充放电管理、新旧电池并联管理等,这样才能确保在使用过程中安全可靠。锂电池的大规模商业应用,使得成本大幅降低,促进了算法和管理技术的成熟,AI预测保证可靠性越来越高(如容量跳水,提前一周预测),实现与UPS的协同。
传统大型数据中心一般都采用冷冻水方案,冷冻水方案存在4次换热,有温控末端、冷机、泵、阀门、塔、水塔等7大部件,制冷损耗高,未来的制冷系统的设计应充分利用自然冷(比如间接蒸发冷却等技术);另外一种方式是变制冷为“智”冷,大型数据中心的冷冻水方案,IT负载耗能占整个能耗的62%,制冷占28%,制冷是除了IT负载外的第一大耗能大户;基于传统专家经验的调优难以达成制冷系统全局最优,而且人工调节周期长,速度慢,无法满足节能降耗的相关诉求。业界有成熟商用的AI节能技术,可先找出制约PUE的关键因素,然后推理出当前IT负载、室外温度下的最佳参数组合,并监督下发,最终实现数据中心能效最优,并有效降低数据中心PUE8%~15%。
数据中心应整体进行评估和优化能耗。提升服务器进风温度,制冷能耗减少,服务器能耗增加,总体能耗存在拐点,因此降低PUE不意味着数据中心总体能耗最优。未来数据中心的基础设施和服务器等会进行上下联动,通过联动,提升能效,降低单位算力能耗,探寻数据中心基础设施+IT联动的最优值。
传统观点认为数据中心是传统落后的风火水电,出现网络安全问题的可能性很小,但是随着数据中心承载的业务越来越重要,尤其是随着金融行业的数据和计算业务越来越复杂,数据中心也面临着网络安全问题,比如最新的UPS可被远程关机的Treck0安全事件。安全可信不仅是网络侧的事情,它需要端到端的解决方案去构筑安全可信的能力。数据中心解决方案在其业务意图之外同时需要具备韧性、Security安全性、隐私性、Safety安全性、可靠性、可用性六个安全可信特征。
一是Resilience韧性:系统受到攻击时能够保持最小核心系统运行的能力;
二是Security安全性:系统对恶意网络威胁的防护能力;
三是Privacy隐私性:系统保障客户的数据和信息的能力;
四是Safety安全性:系统失效不损坏环境或人员及财产的利益;
五是Reliability可靠性:给定条件、给定时间区间内无失效的运行的能力;
六是Availability可用性:系统处于可服务的状态。
从数据中心解决方案角度来看,需要在管理系统层、控制器层、设备单板层、核心功能器件(如功率模块)层均添加入侵监测、安全启动、安全秘钥等设计,并实现组件化功能隔离,当任一层次遭受网络攻击时,系统可以保留最小系统运行,保障供电和制冷的连续性。
因此,数据中心解决方案需要从管理系统、控制器、设备单板、核心功能器件等不同层次做好安全可信设计。
版权声明及安全提醒:本文转自网络平台,文章仅代表作者观点,不代表「金融文库」立场。相关版权归原作者所有,「金融文库」仅提供免费交流与学习,相关内容与材料请勿用于商业。我们感谢每一位原创作者的辛苦付出与创作,如本转载内容涉及版权及侵权问题,请及时联系我们客服处理(微信号:JRwenku8),谢谢!