邬贺铨:西部算力枢纽的机遇与挑战 发布时间:2022-4-22

4月21日,一场别开生面的主题为“聚光·奔赴”的数据中心行业大会圆满落下帷幕。由中国通信工业协会数据中心委员会指导,中国IDC圈与世纪互联共同主办的“2022年第二届中国IDC行业Discovery大会”在线上成功召开。会议聚焦国家“双碳”目标、“东数西算”工程等议题,多位重量级嘉宾汇聚一堂,共同探讨IDC行业的发展蓝图。中国工程院院士邬贺铨出席大会,并发表精彩演讲。

中国工程院院士邬贺铨

以下为演讲实录:

大家好,我的发言题目是《西部算力枢纽的机遇与挑战》。国家启动了东数西算工程,给出了国家八大算力枢纽,统筹围绕国家重大区域的发展战略,根据能源结构、产业布局、市场发展、气候环境等,布局建设全国一体化的算力网络国家枢纽节点,要引导数据中心集约化、规模化、绿色化的发展。它会有四大重要意义:一个首先是优化算力效率,实现全国算力规模化集约化发展;第二是优化能源效率,能就近消纳西部的绿色能源,提高能源使用效率;第三是优化区域协同,能够使得我们算力布局更合理,能够提升我国的数据安全;最后是优化产业结构,能带动其产业上下游的发展。

西部数据中心要善于处理冷数据,通常数据分为冷数据和热数据,冷数据要占到整个数据总量的80%。当然在东部也适于处理那些对实时性可靠性要求比较高的热数据,但是热数据也是相对的。今天的热数据可能过了几个月以后就变成冷数据,那么冷数据调度的时间没那么频繁,适合预防在西部进行处理。那么这个表上列出了适合西部处理的冷数据的类型,在西部处理冷数据具有一个优势是它有低碳。

我们可以看到数据中心的能耗组构成,那么IT的识别占了45%,供电损耗占10%,散热损耗占了43%。优势是处于处理冷数据,而冷数据是调度没那么频繁的,因此如果用磁带处理存储,可能比磁盘存储要节省的多,右下图可以显示我们可以节省73%的存储成本。作为西部,要从规划设计运维的全生命周期来提升数据中心的价值,数据中心首先要规划好。从长远来看,我们能建大型数据中心就不建小型的,能建超大型就不建大型的。因为越大型它的能效越好,效率越高,但是需要按需分级建设、分步投入。那么,通常数据中心的服务器每三四年就要更新了,要更新的服务器,成本更低,能效更好。目前西部数据中心的上架率偏低,右下图可以看出来,我们全国平均的上架率大概50%,而西部更低于50%。

现在来看,用高密度的机架并提升上效率,可以提升高能效,还可以降低每千瓦的成本。有一个数据,北美的机架平均功率为8.5千瓦,跟4.5千瓦的数据中心相比,每千瓦的成本就可以下降68%,另外数据中心需要靠高时效和安全管理等增值服务来开拓市场。但西部的数据中心目前多数是以服务器和机架等出租或者托管服务为主,市场吸引力不高,数据中心的价值也难以体现。还有一点,西部要注意提升算力网络的性能,那么如果丢包率高,则要引起重传,这要浪费很多算力资源。

有资料统计,对重要的业务0.1%的丢包率将导致算力损失50%,还会增加能耗。西部的数据中心的运维管理人才短缺,制约了市场的开拓,当然数据中心不仅要配备运维队伍,还要有市场开拓队伍。目前来看,尽管企业的数据增长速度很高,但是真正企业的数据,目前只有32%的是被利用被激活的,所以未来要发展数据中心,吸引更多的企业数据进数据中心。还有一点,是要从全产业链来完善数据中心的生态,整个大数据的挖掘是有一个很长的产业链的。其中,数据预处理是劳动密集的环节,数据存储和数据计算是重资产和算力环节,而数据挖掘是智力密集环节,它们所相应需要有各种各样的硬件软件和服务来支撑。与东部相比,西部的数大数据的产业链是有明显的短板的,尤其西部如果只注重于数据存储和计算,这是一个重资产和算力环节,投资大回报场,仅仅依靠财政补贴电费和土地出让金这种方式来吸引数据中心入住,是很难持久的。

建议一个是向上游发展,发展数据预处理产业,包括数据的标注、清洗脱敏,并且开展本地数据的挖掘服务。还要向下游发展,引进大数据产业链里头的硬件,包括服务器边缘计算机房设施的生产,以及建立工程和运维队伍,提供数据中心机房建设的工程服务。这里简单说数据中心的机房,除了我们主机房有it设备以外,我们还需要有电力设施,还有制冷系统以及防雷系统、安防系统、灾备系统,还整个里边有硬件软件以及综合布线和各种工程服务。所以建议西部要结合数据中心的发展,发展数据中心机房的服务业,并且积极引进服务器组装产业入驻。

另外,要建设大数据预处理服务基地。整个大数据挖掘涉及到数据仓库、数据清洗,收集数据进行数据的一致性的检查,还要分类标注,然后再按要素分类,根据需求来聚类进行挖掘。其中清洗和标注是建模和挖掘的前提,数据标准已经成为新的产业。我们可以从底下的图看,把一个照片视频送到计算机,它是不知道你想干什么,所以需要先用标注的办法框住。比如说最左边的图,我要分析这个人,第二个左边数过来,第二个是一个街道的状况,究竟是分析人还是分析后边的楼房,还是什么?这里边框住人,我们希望分析人。中间一个图实际上是一个郊区,我们究竟分析森林、树还是远端的山,实际上这里希望分析道路,因为这里用技能驾驶的需要的。那么再过来一个图是我们这里是更希望分析是一个动作,并不在于是人而在于活动。最右边的图是常规的人脸识别,我们现在人脸识别用的很多,但实际上事前都需要训练和标注。一般来讲一个人脸需要有150个特征点的标注,目前数据的预处理其实是由人来完成的,这是一个知识化的劳动密集型行业。人社部把它命名为一个AI训练师的职业,预计到今年全国需要有500万人。

这里举个例子,像百度山西的人工智能基础数据的产业基地,现有的数据标注师就超过2300人,这种预处理不仅仅是标注,还有一种人工智能的训练。比如说阿里有600多名人工智能训练师,训练智能客户的机器人。很多企业都需要客服,但是有些时候像阿里“双11”突然的业务量很大,那么客户的需求量很大,而平时不需要那么大。因此在双11的时候,阿里用智能客服机器人代替了8.5万个客服,完成了97%的在线服务。右上图是一个手机直接上云,我们来玩游戏,由于上云还涉及到中间一些传输的延时,所以手机的上云的双眼效果并不那么好,每秒钟才5~7帧。右下图是通过边缘计算再上云,这个时候大大减少了时延,整个手机渲染的效果每秒能达到58~60帧。而边缘计算本身也是个很大的产业,既有应用服务,也有软件硬件,那么西部实际上可以发展组装边缘计算的产业,发展边缘计算的应用。

有公司预测,全球在今年的全球边缘计算市场能达到133亿美元这么大的规模。当然算力本身大数据是算例的一个主要的组成部分,这里有三个不同的公司,给出了我们国家大数据产业的这种发展趋势。大概在2020年,我国大数据产业能超1万亿元,到2025年能突破3万亿元,年增25%,说明产业实际上不限于大数据,数据服务只是其中之一,前边还有产业基础,各种各样的软硬件。右边还有算力的应用,各种各样的行业。2020年我们国家算你产业规模达到2万亿元,直接和间接分别等带动经济产出1.7万亿元和6.3万亿元,只在算力产业中投入产出比是1:3~4。

最后祝愿第二届IDC行业 Discovery大会顺利召开,发现行业的发展机会,赋能数字社会的进步,谢谢大家。

文章来源于互联网:邬贺铨:西部算力枢纽的机遇与挑战

相关推荐: 必看!长三角数字产业最新政策汇总!

2022年上海市政府工作报告中明确指出,将聚力推进城市数字化转型,加快建设具有世界影响力的国际数字之都。上海高度重视数字产业发展,由此对信息基础设施具有强烈需求和较高要求。 信息基础设施的坚实发展缺少不了政策、环境因素的支持和保障。在过去一年中,上海制定发布全…