数据要素产业
智能数据中心和智慧园区:华为的单点突破与全局效应
如果说过去的数据中心和园区的更新发展主要遵循摩尔定律的话,那么在如今5G、物联网、大数据、人工智能等新ICT技术喷薄而发的时代中,数据已经成为数字化世界中的生产资料,其重要性与日俱增。因此,数据中心和园区的使命也转变成如何高效处理数据和支撑基于数据的数字化创新上。
那么,什么样的数据中心和园区才能符合未来智能化时代发展要求?
在华为看来,智能、极致性能以及超低TCO将会是未来数据中心和园区最重要的三大需求目标。用户的数据中心和园区在面临越来越多复杂的数据环境,从数据的连接、接入到处理、应用等过程都需要更加快速;数据中心和园区在设备层和运维层将融入越来越多人工智能技术,向智能化方向发展成为大势所趋;此外,用户希望通过系列技术来实现数据中心和园区整体TCO的降低。
正如华为企业BG全球Marketing总裁邱恒所言:“华为在数据中心和园区领域希望每个产品都做到智能、极致性能以及超低TCO,并且看重产品之间的协同效应,最终为整个数据中心和园区带来智能、极致性能和超低TCO。”
智能数据中心:从全局到单点
“不谋全局者,不足以谋一域。”
相比于业界普遍聚焦在数据中心某一领域相比,华为对于数据中心更多从全局视角进行打造。这种全局观体现在对于数据在数据中心每一个环节处理的全面洞察,以及在数据中心架构层面上的全面产品。“华为希望基于核心能力去打造端到端的智能数据中心。”邱恒表示道。
图:华为企业BG全球Marketing总裁邱恒
目前,华为已经拥有包括数据中心互联网、数据中心网络、服务器、存储、智能模块化机房等系列产品。更加重要的是,华为的核心芯片覆盖了数据中心所有关键领域,为产品带来突破的同时,也提升了整体数据中心的表现。比如,华为的AI芯片昇腾310涵盖了网络、存储、服务器、互联等数据中心所有产品,从全局的角度为数据中心融入人工智能的能力。邱恒表示:“人工智能给产业带来了极大的推动力,并且在改变各种各样的产品,数据中心也不例外。华为在设计数据中心产品之时,就已经充分将‘智能可以帮助用户做什么’考虑进去。”
全局的视角和全面的产品则为数据中心带来了能力的全面提升。比如,通过AI算法可以实现分钟级的故障定位,IaaS服务发放失败场景从60分钟减少到10分钟,30类典型网路故障诊断小于30分钟,存储故障从过去的人工变成现在的提前自动预测;相比于传统数据中心产品,华为的数据中心产品还能够带来极致性能,在AI训练场景算力可以提升2倍,在核心网络可以提供5倍的单槽位带宽,并且实现0丢包;在成本方面,华为数据中心产品能够带来更低的整体TCO,以100机柜、1500台服务器和10PB可用存储规模的数据中心为例,PUE可以实现1.2,每年能够节省454万度电,相比传统数据中心大幅下降43%。
“华为自身的数据中心就是一个很大的数据中心,华为数据中心产品首先是用于解决自身业务问题,等成熟之后才会推向市场给用户使用。”邱恒补充道,在强调产品之间协同带来更加出色的整体效果之外,华为明确表示其全面产品并不是对用户的一种捆绑。“对于大多数用户,其数据中心的升级换代都是逐步升级的过程,不同的层级通常也是不同的更换周期。华为的数据中心产品一直秉承松耦合设计理念,首先在单体上让用户获得更好的效果,也可以通过产品之间协同为用户提供更佳的整体效果。”
数据中心的核“芯”能力
华为数据中心众多产品的突破,离不开华为的核心芯片能力。除了昇腾310 AI芯片之外,华为的数据中心产品中还包括鲲鹏920处理器芯片、SSD控制芯片、智能融合网络芯片、智能管理芯片、BMC管理芯片、智能多协议接口芯片、oDSP等多款核心芯片。
以华为TaiShan服务器为例,包括鲲鹏920服务器处理器、昇腾310AI芯片、Atlas 300AI加速卡、Hi1822智能融合网络芯片、Hi1710智能管理芯片、Hi1812智能SSD控制芯片,核心芯片贯穿数据的传输、计算、存储和管理全过程。邱恒表示,TaiShan服务器是华为一系列芯片打造出来的产品,可以为数据中心带来高效能计算,“在HPC高性能计算场景中,Taishan服务器采用全液冷冷却之后,可以将PUT做到小于1.05,并且对于像大数据、数据库、分布式存储、HPC等应用性能有大幅提升。”
而华为的OceanStor 全闪存产品作为业界最快的智能全闪存也要得益于其核心芯片的加持,除了昇腾310芯片之外,华为的SSD控制芯片、BMC管理芯片以及多协议接口芯片对于华为全闪存的性能提升也帮助巨大。此外,华为的智能模块化机房也融入了昇腾310 AI芯片,利用深度神经元网络AI算法来实现智能化管理,以及超低的TCO。“华为的智能模块化机房可以实现智能供电、智能降温和智能管理。在100KW的数据中心场景中,华为的智能模块化机房每年可以比其他方案节省13万kwh。”
与此同时,华为也强调数据中心生态链的巨大价值。邱恒直言,华为始终是以“客户为中心”的原则,并不会排斥一些友商的芯片产品,“我们一直采用多供应商策略,哪个部分是客户最需要的,华为就会优先去解决。华为在核心芯片领域已经耕耘很多年,核心逻辑就是从商业角度、创新角度等可以自己控制创新的节奏。”
CloudEngine:单点突破最佳实例
在华为众多数据中心产品中,数据中心交换机CloudEngine系列可谓是单点突破的最佳例子。
众所周知,用户数据中心的应用负载近年来发生了巨大变化。在互联网和移动互联网时代下,数据中心的应用负载以视频/音频、网络应用为主,其流量更多是以南北向为主。而到了智能时代下,AI应用、大数据分析、微服务架构、分布式存储等应用带来的则是更多的东西向流量,这种转变对于数据中心带来了高带宽、低时延和低丢包的要求。比如,像人工智能的深度学习训练,通常起步就是十万个数据样本,对于数据高效处理有着极高的要求,并且分布式的处理架构也容易带来对网路性能影响很大的动态时延,通常一个丢包就会给深度学习训练的效果带来直接影响。
华为CloudEngine 16800系列交换机作为业界首款面向AI时代的数据中心交换机,正是为AI时代的数据传统和交换而设计,采用基于以太网的RDMA技术、AI芯片、iLossless算法,大幅提升了网路性能,真是实现了0丢包和降低动态时延。邱恒表示:“CloudEngine可以让AI训练效率提升27%,高性能计算时间缩短30%,分布式存储性能提升30%。”
以华为CloudEngine 16800数据中心核心交换机为例,其单槽位可提供业界最高密度48端口400GE线卡,单机提供业界最大的768端口400GE交换容量,交换能力高达业界平均的5倍;采用RDMA通信技术,内嵌了昇腾310芯片,通过iLossless智能无损交换算法来实现流量模型自适应自优化,在零丢包基础上获得更低时延和更高吞吐的网络性能,从而满足AI时代的网络流量需求。
“CloudEngine 16800突破了信号传输、散热、供电等多项技术难题。相比于友商,其整机满配一年可以节省32万kwh,真正让用户拥有超低TCO。”邱恒表示。
智慧园区:端到端产品和方案
与企业数据中心建设水平参差不齐相比,大部分园区的建设和发展陷入同质化困境。作为城市发展和人们生活与工作的重要载体,园区在面对技术、模式、场景等出现前所未有的快速变革之际,并未很好地去适应这种变化趋势,自身普遍处于发展“滞后”的状态,很多园区陷入了“建成即落后”的怪圈。
在邱恒看来,正是因为园区水平落后,使得智慧园区在未来拥有着巨大的市场,而华为则希望通过端到端的产品和解决方案去满足园区市场的需求。据悉,华为智慧园区已经形成了7个通用应用场景+4个行业园区解决方案,其核心的数字平台是业界唯一横向融合云、AI、IoT、大数据、融合通信、视频、GIS等新ICT技术,纵向打通端、边、网、云的平台。
“华为以自己的园区为试验田,自己的降落伞自己跳,然后将孵化成熟的智慧园区解决方案推向市场。”邱恒透露道。事实上,华为自身就是一个典型的园区,拥有办公、工厂、酒店、学校、物流等丰富的园区形态,业务遍布全球170多个国家、办公地点多大900个,超过600万个管理对象,园区形态复杂,管理难度大。
从两年前开始,华为启动了自己智慧园区的建设,将所有产品和解决方案在自己园区项目中进行考验,然后走向成熟。邱恒表示,目前,华为园区已经实现了电力消耗8%的下降,安防误报率下降90%,事件响应事件下降73%。
邱恒介绍,华为的园区产品很多都是融合性的创新,由于华为在通信领域积累的很多技术和经验,当园区在技术层面开始走向融合之际,华为的融合性创新产品则彰显出巨大的价值。“以AirEngine为例,AirEngine拥有更高的效率、更低的时延,是源自于华为5G的WiFi,包括了5G蜂窝技术,这是市场上一般WiFi产品所不能比拟的。”邱恒介绍,“另外华为的新一代摄像机,是智能和5G加持,融入了5G微波技术,可以做摄像回传,并且也采用昇腾310 AI芯片,大幅提升图像处理能力。”
写在最后
“任凭风吹雨打,稳坐钓鱼船。”
邱恒透露,今年下半年,华为将会有包括全闪存、光互联等在内的多款数据中心产品陆续推出。“两年之后,华为的数据中心和园区产品线将会更加强大。”之所以有如此自信,离不开华为已经在数据中心领域构建起端到端的核心能力,实现从单点突破到全局协同效应。
未来,随着AI、大数据、物联网、5G等技术和应用的深入,数据中心和园区无疑将加速变革,用户对于智能化、性能以及TCO的追求也将愈发突出,华为作为业界为数不多从芯片、设备到整体运维与管理都有能力的公司,其数据中心产品和解决方案必将大有作为。