王建冬:构建“东数西算”国土空间算力资源 调度体系的政策思考 发布时间:2022-4-21

4月21日,一场别开生面的主题为“聚光·奔赴”的数据中心行业大会圆满落下帷幕。由中国通信工业协会数据中心委员会指导,中国IDC圈与世纪互联共同主办的“2022年第二届中国IDC行业Discovery大会”在线上成功召开。会议聚焦国家“双碳”目标、“东数西算”工程等议题,多位重量级嘉宾汇聚一堂,共同探讨IDC行业的发展蓝图。国家信息中心大数据发展部规划处处长王建冬出席大会,并发表精彩演讲。

国家信息中心大数据发展部规划处处长王建冬

以下为演讲实录:

非常荣幸有这样一个机会参加今天的这样一个大会,我今天汇报的主题是《构建“东数西算”国土空间算力资源调度体系的政策思考》,那么这也是我们这个团队在过去的三年里边围绕这个领域研究的梳理和总结。

我的汇报主要是三个部分,第一就是介绍一下东数西算这样一个工程它所出现的这样一个时代背景。实际上,最早我们关注这个领域是在2016年的年底,当时总书记在中央政治局的一次集体学习会上就提出来,要建设全国一体化的国家大数据中心,这个提法非常新。那么后来我们就按照国家发改委的要求,开始围绕构建全国一体化大数据中心体系开展研究,一直到2020年的年底这个文件正式印发,前后我们研究了三年多的时间。那么在这过程中,我们也注意到,为什么总书记要提出来构建这样一个全国一体化的大数据中心体系?实际上,它的一个很重要的时代背景,就是我们国家正处在一个从数据大国迈向数据强国的这样一个特殊的历史阶段。中央网信办在2020年底的时候发布的一个调研报告里边又提出来,2019年全球主要国家的数据资源的存量,美国排第一,中国排第二,但是我们预计到2025年年底也就是我们的十四五期末的时候,中国的数据资源的总量会超过美国跃居全球第一,也就是我们实际上已经是一个不折不扣的一个数据大国。但是我们也注意到在数据发展的过程中,我们的很多结构性的问题依然存在,就使得我们的数据强国的道路还有很长的路要走。

我们这里还是举这个报告里的两组数据来做一个说明。第一组数据就是,2019年全国各行业的数据资源的一个产量,政府是排第一,但是它的总量现在已经从过去占据80%,已经下降了占据22.4%。而80%以上的数据是来自社会数据,比如说互联网、金融、公共服务、制造业、电信、交通、新闻媒体这些行业。那么这也就提示我们,实际上目前我们全球的数据资源的分布正在发生一个逆转,就是当前的全社会的信息化发展的一个主要格局。从过去我们关注政府内部的政务数据的整合共享,正在面向全社会去关注整个全社会的数据资源的这样流通和存储调度治理这样一个完整的体系,这是我们第一个背景。

第二个背景就是我们从这个区域上看,我们知道我们国家的东西部之间有一个非常著名的一条线,就是“胡焕庸线”,那么实际上在数据里同样存在这样一条线。在这条线以东,我们国家的国土面积占据是1/3,但是它的数据资源的总量占据到85%以上。这条线以西的这些国土面积,我们数据资源的总量只有15%,也就是我们的数据主要是在东部。但是另外一方面我们注意到,我们国家的大规模的数据中心、超大规模的数据中心集群,和我们的风光电水电这些绿色资源的供给,主要是在西部。所以基于这样一个特点,黄奇帆教授在去年的一篇文章里面就提出来了,他说要构建一个国内的大循环,就是要在西部就近布局一些计算中心,然后通过“东数西算”为东部提供低成本的这样一个云计算服务,这是我们国家未来构建这样一个双循环的非常重要的核心路径。这对于我们下一步去提升整个数字经济发展的这样一个总体的水平的战略意义也是非凡的。

那么第三个背景就是我们说从增量上来看,未来的十年是一个叫做“连接大爆炸”的一个时代,也就是我们随着5G工业互联网这样一些新的技术的普及和应用,每个人、每个企业、每个家庭、所拥有的数据的流量的规模都在出现一个10倍甚至几十倍的这样一个增长。在这个过程中,我们的整个的现在的语音加智能的模式正在从朝向于云边协同和数字协同的这样一个模式去裂变和升级。未来5G时代,我们国家的算力资源的总体的规模可能会有一个巨大的缺口,我们的算力供给的增长速度是远远跟不上我们的算力需求的速度,这就是我们为什么要去推动“东数西算”。一方面是要为现有的存量结构的优化去提供一些路径,同时我们还要为未来的发展的增量部分预留出来足够多的战略空间。

过去的一年多时间里边,实际上是我们国家的数据的立法年,包括《数据安全法》,包括《个人信息保护法》先后出台,然后十四五规划首次把“信息化发展”单独列了一篇,用4章的篇幅去进行了一个详细的论述。在这过程中我们也注意到,包括我们的中央政府,目前超过60%以上的部门已经在启动或者已经在建设本行业的这样一个大数据中心的体系。在这个地方层面,超过80%以上的地方已经成立了专门的大数据管理部门,也就是说我们整个国家的这样数据资源的整合共享体制机制在不断的优化和完善。这是第一部分。

第二部分,我想重点介绍一下我们目前构建全国一体化大数据中心体系的一个总体的建设框架,我们在2020年底的4部委的指导意见里边就提出来,要促进这个东西部之间的算力,资源的优势互补和数据资源的汇聚流通。那么按照这个要求,我们在去年的5月24号,由四部委联合印发了全国一体化大数据中心体系算力枢纽节点的一个实施方案,这里边就正式把东部的京津冀、长三角、粤港澳、成渝以及西部的贵州、内蒙、甘肃、宁夏的枢纽节点的方案正式的抛出来,然后推动这两类节点之间的这样一个“东数西算”。

那么我们如何去理解这样一个一体化,实际上这里边有三个因素需要我们去考虑,第一就是要一体化的考虑我们的数据中心、云数据的流通治理,数据的应用,数据的安全领域的一个衔接。第二就是要一体化的去推动我们的政企之间的数据资源的融合和发展。政府向社会开放数据,同时企业为政府要提供专业化的数据服务。第三,就是我们要一体化的运用我们的政策引导,规范的制定,体制机制的改革,技术创新,工程的牵引等多种方式来就协同解决我们的大数据发展的这样一些制度问题。

围绕这样的总体思路,我们就提出来了叫5个“数”,从底层的“数网”就是优化我们的数据中心的建设布局,到“数纽”就是要推动我们的算力资源的一个服务化。再到“数链”加强数据要素市场的一个培育,再到“数脑”就深化我们大数据的协同应用创新。“数盾”强化我们的大数据的安全防护的能力的这样1个建设,通过这5个数来去构建一个新的这样一个数据中心的总体框架,就涵盖了国家区域省和机构多个层面,然后从数网、数纽、数链、数脑各个层面上去实现东西部之间的一个数据资源的整合汇聚和算力资源的一个统筹调度,这是我们东数西算工程的一个政策背景。

那么在具体的推进模式上面我们就提出来,要分级分类分步推进,从国家到区域再到省一级去“试点先行,梯次去推进”。第一步,就是我们在数网层面上,我们说现在建设的8个算力数据节点,那么这实际上是我们主要围绕数网的流通和完善去进行一个布局。在这过程中,核心的一个理念就是要构建东数西算的数网体系。这是我们做的前期的调研,目前我们国家的算力资源需求不足的省份主要是在西部,而需求过剩的省份是在东部,也就是我们的东西部之间的算力和数据的分布是错配的。未来通过东数西算工程就要实现这样一个算力和数据之间的这样一个流通和调度,就是我们的东数西算,要把“瓦特”的流动转化为“比特”的流动,这样实现我们整个的产业的转型升级和当地的就业的有效促进。

第三部分我想重点给各位汇报一下,我们东数西算工程推进了一个实施路径,那么这里边我们说一个核心理念就是要从“东数西存”到“东数西算”。过去的几年里边实际上包括贵州,包括内蒙很多地方都在大规模建设西部的一些数据中心集群。那么为什么我们到今天提出来要去推动东数西算?我们通过调研就发现,实际上过去的十年里边,我们的西部的地方这些数据中心的发展,实际上是一个东数西存的模式,就是我们的数据的灾备存储是在西部,但是主要的应用实际上还是在东部地区。

我们从亚马逊在东西部的案例来做一个分析。亚马逊的公司在中国有两个数据中心,一个是在宁夏是属于西部的节点,一个是北京属于东部节点。我们就发现存储的业务,东西部之间的价差大概是20%左右。但是如果是考虑到数据网络的传销,包括数据的流动时延,可能在西部存储的经济成本其实并不占优。但是我们看到计算优化型业务和 GPU型业务,东西部之间的价差会达到40%以上,也就是在西部去布局这样一些东数西算的节点,它的成本优势是巨大的,会使得我们整个的东数西算的经济的可行性得到有效的加强,这就是我们说现在要提出来从“东数西存”走向“东数西算”的重要的背景,就是它有一个更加直接的经济的可行性,同时它有更加明确的产业带动效应。因为东数西算会使得企业的计算业务落地在西部,而且计算业务会使得它和企业周边的业务发生关联,同时在西部上催生更多的劳动密集的数据服务的产业。

那么围绕这样一个基本想法,我们就提出来从“上云、用数和赋智”三个层面去设计我们东数西算的推进路径。首先是在上云层面上,就是要探索“第四方云”的云数网联动转型的模式。我们说大的技术逻辑就是云化,就是我们的企业的数据中心都在往云的方向去转化,而我们说未来的一个很重要的路径,就是要探索类比于我们的“第四方物流”的这样一个第四方云的模式,也就是我们现在有很多国外的企业就提出来,像云MSP就是这样的一些模式正在盛行,而未来我们的东数西算就是要构建一个能够独立于我们的各个工业云之上的统一的算计调度的云的解决方案,同时解决这些企业上云和迁移成本比较高的问题,然后实现云资源的东西部之间的自由的调度和流通。

第二就是在用户层面上,也就是要构建一个前店后场式的这样一个新型数据应用的架构。目前企业的这样一个模式就是要把高频的应用放在东部,它离用户近,而对时间要求不敏感的这样应用放在西部实现节约,参考像类似华为这样的模式,就是要形成一个覆盖全球或者说覆盖全国的一个超远距离范围内的这样一个数据资源和算力资源的一体化调度的这样一个体系,实现前面后场的模式,就是把前店放在东部,后厂放在西部,实现前店后场的两个数据中之间的调度和流通。

第三个层面就是叫在复制层面上,就是要构建人工智能双立资源的一个密集型的这样一个外包服务的模式。实际上,在人工智能这个领域,大部分的算力需求实际上是属于算力消耗非常厉害,但是时延要求并不高,比如说我们游戏的画面渲染,短视频流的优化,包括各种算法模型的建模和升级,那么这些实际上它对于这个时延是没有要求的,这是完全看我的带宽和电力成本的考虑。在这种情况下,我们就可以把很多放在东部的这样一些 AI算力模型训练的任务把它放到西部去,从而实现一个成本的有效的降低。那么我们也注意到很多厂商,比如说像金山云,现在已经在做这样一些GPU的“算力石”,而把这个算力石放在西部,为东部的这些人工智能的研究院和厂商去提供一些远距离的算力服务,那么服务可以有效的节约我们的人工智能企业的这样一个运营成本。

我们就提出来未来可能在比如像甘肃贵贵州这样一个地方去构建面向北、上、深各个人工智能平台和产业生态的集中的人工智能的超算基地,这个可能是未来的一个很重要的发展方向。在推进机制上面,我们觉得有这样几点思考,第一就是要搭建这个东西部之间的网络的直连通道,这是非常关键的,就是我们说未来跨省跨网和跨域的一些数据之间的流通和调度,应该是要大幅度的降低成本,同时要提高时间的表现。我们也注意到像中科院计算所这样一些机构已经提出了一些像“信息高铁”模式来去解决跨域的算力调度的问题。

我们在资本层面上说要构建一套东数西算的产业基金,把政府和设备的提供方能源的配套,网络的配套,建设运营和云服务的厂商要联动起来,形成在资本层面的纽带,然后实现各方的利益的共享。

我们呼吁,未来要成立国家的东数西算的产业集团,就是实现东部和西部的数据中心资源的一个一体化的投资,一体化的建设,一体化的运营,来有效的降低我们整个东数西算的协调成本和运营成本,为企业提供成本更加低廉的算力服务。

这是我今天的汇报的主要的内容,那么我们也希望接下来能够跟各位领导和各位专家一起围绕东数西算话题,进行更多的研究和讨论,为国家的数字经济发展贡献更多的力量,谢谢大家!

文章来源于互联网:王建冬:构建“东数西算”国土空间算力资源 调度体系的政策思考

相关推荐: 辛国斌:创新是引领全球经济增长的关键动能

2022年3月31日,由中国工程院、上海市人民政府、工业和信息化部共同主办的第六届创新与新兴产业发展国际会议成功举办。工业和信息化部党组成员、副部长辛国斌出席会议并作主旨发言。 辛国斌指出,创新是引领全球经济增长的关键动能。中国政府始终高度重视科技创新,特别是…