【IDCC2020】北京优锘科技有限公司资深解决方案专家郭逸昕:数字孪生数据中心的黑科技 发布时间:2020-12-10

2020年12月8日-10日,第十五届中国IDC产业年度大典在北京国家会议中心正式召开。作为数据中心云计算产业内知名的盛会以及IDC企业、电信运营­­商、互联网、金融、政府和厂商等产业上下游的高效沟通平台,与会嘉宾包括政府领导,行业专家和企业代表数千人。以“数据中心新技术与应用”为主题的分论坛于10日举行,北京优锘科技有限公司资深解决方案专家郭逸昕做了《数字孪生数据中心的黑科技》的分享。

各位来宾,大家好,刚才严瀚总讲到最后的时候提到了数字孪生,我们前面真的没有串通好。我以前是中石油数据中心的,做了五年多的基础设施运维,后来到优锘科技有限公司开始做IT和IoT解决方案的架构。

我的题目是数字孪生数据中心的黑科技。跟大家先做个游戏,正常的话看到这个东西大家会先读这一行,然后看到这一行,最后不知道这个地方能不能看到?才会读到最上面黑色的地方,这个是视觉给大家带来的习惯,我们会有一个惯性,可视化干的就是这个。我们会用一个人类反常的观感感觉结合我们的一些思维等等,给大家做出可视化数字孪生的数据中心,最后发一个彩蛋。提到可视化,其实人类整个思考的过程就是建立在一个思维视图的过程,可视化是用大量的技术把复杂抽象的东西变成大家可以快速消化理解的。大家以前炒股最早可能看到的都是一些交易量,我每天增长的数值。后来我们发现这个方法可能还是看不懂股票,这个股票到底好还是不好?我们后来有了折线图和蜡烛图,用了这个东西会帮助我们更好的判断股票到底是好还是坏。可视化是眼睛可以通往心灵深处的优势。

数字孪生的数据中心到底长什么样?给大家放一段小的视频。这个是我们在建行的稻香湖做的,这是室外的管线,进入室内可以看到每个楼层,可以做纵向的展开,可以做机房内的布局,可以定位到每一台设备。我们可以看到它的数值,还有对接底层的动环。

还可以看到室内的管线,有哪些信息数据。到了整个的机房内可以基于动环的温湿度传感器生成云图,可以帮助数据中心的管理者快速判断这个数据中心哪里有这些局部热点。

我们优锘科技有限公司可以给各位提供一个完整的数字孪生的技术站,从最底层可以接入大量第三方IoT和IT系统,我们还有一个ThingJet的系统,还有CC运营整合中心,还有OIC这个部分是做数字孪生、数据分析,最终在OVC,运营可视中心可以给大家搭建不同的场景,包括智慧城市、IT运营和智慧园区。我们现在形成了三大产品中心和19个标准产品模块,这些产品模块里面的所有子功能是互相解耦的,我们将来不管想选择哪个产品中的某一个功能把它们可以任意组织在一起形成最终的可视化和数字孪生的场景。

刚才提到了在整个数据中心里面首先可以看得到,就是我们的设备、机房结构,其实这个在学术上有一个专业的词汇叫欧几里得空间,我们还有大量的逻辑方面,包括IT架构和制冷的拓扑和供电的拓扑,这些拓扑图是在我们的脑子里面的。像以前运行的监控中心都有大的配电系统图,就是当出了事要从那张图上找到这个UPS出了问题,它可能会影响哪些末端的PDU和哪些柜子。但是这部分图只有专家对这些东西更熟,如何让一个值班的人员也能看懂这张图?我们带来了第二段视频。

我们首先基于整个供电制冷的系统图形成这样的类似于元素周期表的一段排列,点击任意一个能源动力,我们可以看到跟能源动力所有相关的,点击高压配电系统就可以进入高压配电系统里面的图,而且它不仅仅是一张图,是靠数据驱动的,我们可以看到它的告警,可以关联其它系统,同时可以打通和三维之间的关系,我们同时具备了从逻辑方面看到上游和下游都有哪些,同时还可以定位到物理空间,现实世界中这台设备到底出现在哪个位置出现了问题。这样就可以给我们的日常运维工作,包括真的遇到了一些解决突发事件的时候,可以更加快速便利。

黑科技一:希尔伯特时空数据库,物理空间就是我们的最底层机柜、UPS、空调设备。往上不管是虚拟的资源池还是基础设施,还是应用平台、业务的交易,这些都是所谓的逻辑架构。我们整合了三维的物理空间,就是欧几里得空间,还有N维的数字空间形成一个希尔伯特空间,大家学高数的时候不愿意回忆的事情。我们在此之上加了时间维度,可以帮助各位分析和追溯,最终形成了希尔伯特的时空大数据

黑科技二:围绕希尔伯特要了解一下希尔伯特的三要素都有哪些?首先这是一个画出来的真实世界的抽象图,刚才提到的不管是UPS、空调、IT设备都是实体,实体之间会有关系,这些关系包括人与人之间有连接关系、依赖关系、安装关系,在每个实体之上其实我们就会把实体和关系结合到一起,形成所谓的知识图谱。在实体的时候,每个实体都是有活动的,人会每天到处玩儿,会去工作,设备每天都在运行,这些不断活动的实体就会形成了我们的这些活动,有了这些活动,我们就会得到一些运行状态,比如我的空调运行状态,UPS的实时功率,还有产生一些指标,这些指标还有不同的维度分级,比如说到的什么阀值到什么阈值会产生告警。

黑科技三:希尔伯特三大分析能力。首先是时序分析能力,我们可以追溯原有的历史数据,判断现在运行的设备是不是运行的很正常,并且还可以延伸去推算未来它可能会产生哪些告警。

第二个欧式空间的分析能力,刚才提到的欧几里得空间。这张图我们基于三维坐标系和空间之间的设备与设备之间的物理关系形成的欧几里得空间。简单描述一下,比如说我这里有一个摄像头,假设对面是一块玻璃墙,在欧几里得空间里可以算出这个摄像头的视锥可以直接穿过这扇玻璃墙看到对面的东西,如果是实体到那面墙就结束,这是一个三维的效果。

最后是图的三维遍历分析,比如我有一个故障的变压器,我再到下一级有影响,就会结合空间和时间,最终可以告诉我们哪些系统受到了影响,它可能会影响我们的哪些客户,哪些厂商受到这个影响,原定的维修计划是不是因为这件事情受到了影响要提前。这是我们讲的关于希尔伯特的三大数据分析能力。

再举一个小例子,机房起火。这个事在数据中心里发现的很少,但是现在数据中心越做越大,可能除了数据中心机房本身以外,可能更多的开始往智慧园区这方面发展。我举了一个起火的例子,因为安全第一。在7:40的时候,这是以前一个真实的事情改的,数据中心某个区域有烟感告警,所有的消防告警都是最高级别的告警,而且要求我们的人员必须去现场查看,这种时候消防人员不得不去现场看,跑到那儿的时候过了5分钟了,发现火势已经难以控制,他拨打了119,打开机房内的灭火开关,通过喊话的方式疏散周边的人员。7:58工程人员赶到,切断电源,封闭风机,然后再往后其他消防人员到现场抢险。我们基于希尔伯特的时空数据库可以实现什么呢?两个烟感和一个温感产生了告警,可以通知业务人员可能发生了火灾,但是下一步会自动调取跟烟感和温感同一个房间内的摄像头,去看已经起火了,节约了人去现场的时间,我可以中控室打开应急广播,疏散空间的人,我可以给各个房间打开它的应急广播,同时可以远程启用我对应的区域灭火系统。我的工单可以开始自动流转,我可以派发到工程部的人员确认,确认这件事情永远要做,然后手动关闭,像电源,关闭风机的设备,最后消防人员赶到做一些善后工作。我们发现同样一件事情,如果基于希尔伯特空间数据库,可以节约整体的时间,从原来的35分钟变成8分钟。

黑科技四:数据规则引擎。我们在现实世界有大量的设备和系统,我们可以理解为对象,就是配置处理引擎,我们可以把原有产生的一条告警上面的通知某台设备或者一个设备的编码,我可以对它进行更优化的丰富,把底层想要关心的更多信息拿出来。还有事件处理引擎,我们有丰富、标准化、重顶级、过滤、维护期、压缩、派生、升级、归集,到最后故障,最终可视化呈现,还有性能指标。

这种可视化的配置最后会形成一个什么样的东西?首先假想这是大家常用的事件告警台,和其它的告警台最大的不同可以看到告警来源,这个地方可以去接入不同的监控系统,原先大家一直想我们要建一套统一的平台或者统一的告警中心怎么建呢?我需要接配电系统,暖通系统,还有动环。但是它的数据接入能力是现在很多地方不能说为之诟病,但是会存在一定的提升空间。我们会根据做的1200个标准的项目,已经积累了大量的已开放的API接口,我们可以对任意一个系统做到即插即用,我们把来自不同系统的数据进行统一的接入后,我们会做第二件事就是重新定级,严重、一般、其它。因为不同的系统告警等级不一样,有的是七级,有的一级,到底是严重的事情更严重?还是紧急的事情更紧急?这是看一大堆系统的时候没办法判断的。我们会结合客户实际运维的经验,以及他们实际对于每一件事情的评估,我们会把这个事情做重定级。依据也有很多,比如一级最严重的30分钟内必须解决,二级在两个小时之内解决,一级可能通知到最顶层的领导,大半夜两点也会叫起来。二级就会推送给它的主管。

还有一步是标准化,我们会对这些告警事件的来源进行标准化控制,这个规则简单来说就是把很多监控系统推送的时间,某一个设备,发生了一个告警,这样可能都算是说人话的,我们可以进一步把这个人看不懂的告警条变成一个人能看懂的一句话。同时在这个规则里面还有一条规则,叫丰富规则,主要是帮助一线员工可以知道我出了这件事情找谁,把跟这个设备相关的属性信息、配置信息进一步丰富,这台设备是属于哪个厂商,厂商的维护人员是谁,他的电话是多少,我们自己这边的负责人是谁,负责人的电话是多少,这样让一线的运维人员遇事不慌。

最后这个是我认为比较重要的规则引擎的能力,就是归集。我们曾经在某个银行把它日均3万条告警压缩到100,从人根本不会看的量,到现在慢慢处理过来了。但是我们不会保证这个数据中心不会产生新的告警风暴,比如说这个监控断了,整个监控系统一直会产生大量的告警,可能一秒钟就推出几万条,十几万条。我们压缩过了,为什么还是这么多?这个时候还是基于所有对象之间的关系和它的空间关系,我们可以对这些告警做一个归集,比如说所有的设备来源于市电A路,我就可以说市电A路的系统产生了告警,或者都是来自于A栋的1号机房,我都归类到1号机房3万条告警,这个时候一线处理人员就知道只要跑到那几个地方就好了,不需要多跑其它的地方。

黑科技六,我们可以对象和关系为核心,形成一体化的建模。这是我们一般在配置管理里面用到的,从客户一直到最后机房安全设备,包括一些服务器负载均衡,我们会建立可视化的配置模型的搭建。还可以在这里增加很多的指标数据,最终有了这个之后会存在什么呢?不知道有没有人搞过CMDB?我自己实际搞过。有一次我们办错了一件事,我们需要重新导入一批数据,完全按照曾经的表一个一个导,导进去发现以前建立的关联关系都断了。基于可视化的建模形式,我们就可以去绑定出像这个地方机柜里面会有我的IT设备,会有我的网络设备,会有我的负载均衡,我只要提取了这个新的配置项里面的关键字段属于负载均衡,属于我的IT设备,我就可以自动关联到相关的机柜。

核心逻辑,我所谓的对象里面会有跟它相关的事件、配置指标,等等,我们建立一个运维的知识图谱和知识图谱的大数据。对上提供数据服务的超市,可以提供包括数据搜索、组装、订阅及提取它的API,自动推送到其它系统让这些系统使用来自于一体化建模的数据。我们可以从底层的视频、门禁系统获取后台的应用数据,这时候就是会涉及到刚才提到的底层的接入层强大的数据能力和加工流水线。

黑科技七,免代码的配置后台。这是我们的系统后台,所有的这些设备都会以拖拽的方式,以及直接导入一个新的数据表录入的方式修改,跟咱们平时用Excel没什么区别。核心是现在维护这个可视化的系统不需要去懂代码,我们只要懂逻辑,知道这些设备应该在哪儿,包括我的告警要调成什么颜色,不同级别定义什么颜色,都是拖拽式的配置。

最后,我介绍一下优锘科技有限公司。上面是我们的愿景,让人们更好的认识和管理新世界,优锘不是酸奶的诺,它是化学的微量元素,60分钟就会更新一次。我们成立于2012年,主要来自于数字孪生技术、IT管理软件和物联网技术三波人组建在一起。公司今年是680多人,12年成立,到13年同时启动了跟IT和IoT两条产品线的研发,到2017年正式发布了IT智能运营平台,到2019年1月公布的数据是2018年的销售额突破了1.2亿,整个融资背景到今年7月份是B+轮的融资成功。

今天我的介绍主要是这些,如果各位有什么感兴趣的也可以直接加我微信,随时跟我沟通。

文章来源于互联网:【IDCC2020】北京优锘科技有限公司资深解决方案专家郭逸昕:数字孪生数据中心的黑科技

相关推荐: 信通院:截至10月底,全国增值电信业务经营许可企业共90182家

11月12日,中国信通院发布《国内增值电信业务许可情况分析报告(2020.10)》(以下简称报告)。报告指出,截至2020年10月底,全国增值电信业务经营许可企业共90182家(其中4496家企业同时持有工业和信息化部及省通信管理局颁发的增值电信业务经营许可)…