熙熙攘攘的街头,交通和安控摄像头不断观察着每一个通过的车与人,即时排除安全隐患;一块晶圆走下生产线,会被在极短时间内进行细致入微的检查,确保最终芯片生产的良率;钻井塔旁,检测系统通过人眼无法辨识的细节来区分油田的品质……
这一切,都离不开AI——人工智能技术的支持。
人工智能在近年来已经为人所熟知,逐步走入了人们的生产、生活。而对于人工智能的最底层技术——芯片,依旧保持着神秘的色彩。
10月26日,在主题为“智算·新际”的2021人工智能计算大会(AICC 2021)上,鲲云科技合伙人、首席运营官王少军博士接受了媒体的采访,深入浅出的介绍了鲲云科技研发的“数据流AI芯片(CAISA)”,并分享了他对AI芯片产业发展的看法。
鲲云科技合伙人、首席运营官王少军博士
高效、易用、通用
相比于业界常用的指令集芯片,数据流芯片“另辟蹊径“。据王少军博士介绍,数据流架构是一种高性能计算技术,应用于需要高性能计算的场景。鲲云科技将这种技术应用到了AI芯片的研发中,并成功推出了数据流AI芯片。
目前主流的AI芯片均为指令集架构的AI芯片,计算操作、存储操作无法完全并行起来,芯片利用率的提升有限。鲲云科技所研发的数据流架构跟指令集架构的主要差距在于计算过程是没有指令的,并且创新性地实现了数据计算和数据存储过程的并行,两者结合极大提升了芯片利用率(算力利用率),从而提升整个芯片的性价比,这是数据流AI芯片的核心的优势。
根据王少军博士介绍,目前指令集架构的AI芯片在实际运行场景中,大部分只能发挥出峰值算力的30%左右,一些特殊情况看下甚至10%都不到,芯片利用效率较低,而数据流AI芯片实际应用中可以达到65%-95%左右的芯片利用率(算力利用率)。
考虑到用户在部署和应用上的便利需求,鲲云科技为数据流AI芯片研发了RainBuilder编译工具链。通过RainBuilder编译工具链,用户和开发者无需了解架构的底层硬件配置,轻松就可以实现应用部署。
“工程师在部署数据流AI芯片过程中,只需要聚焦API即可。”王少军博士介绍,RainBuilder的驱动层对用户透明,快速完成算法自动部署,可以说用户能够“无感使用”。
此外,在“百花齐放”的AI芯片市场,很多产品为了切入细分市场领域对芯片进行了定制,针对某一场景(的AI算法)进行适配和优化,通用性并不高;鲲云科技则认为,通用性也是芯片的核心指标之一。作为一款AI专用芯片,为了平衡通用化AI算法支持与定制化高效率计算架构之间的问题,鲲云的数据流AI芯片CAISA在底层架构设计时,引入计算层的概念,针对每一种计算层进行硬件运算的实现,以支持几乎所有当前的被使用的神经网络计算,在“深度可定制化”的同时达到“高通用性”。
场景、合作、生态
王少军博士介绍,鲲云科技从2018年起开始研发数据流AI芯片,如今已经更新了三代。而这段时间,也正是AI产业逐渐成熟的阶段。鲲云科技与业界共同摸索,逐渐为AI芯片的应用落地寻找到了合适的算法、场景和商业模式。
2020年6月,鲲云科技实现了数据流AI芯片CAISA的量产,同期推出了面向边缘端的星空X3加速卡、面向云端的高性能计算加速卡星空X9加速卡,以及面向边缘计算的加速盒子星空X6A边缘小站。2020年底,鲲云科技联合浪潮发布了基于星空X3加速卡的AI服务器,将产品提供给最终的AI算力用户。
如今,数据流AI芯片及衍生产品已经在众多领域落地,其中就包括本文开头提及的智慧城市运营、晶圆缺陷检测、智慧能源等领域。
“2025年,端、边、云AI算力占比将达到80%。”王少军博士表示,AI市场目前极具繁荣,其中AI推理芯片市场仅中国地区今年一年就达到了400亿元的规模,并且市场需求还在急速攀升。
市场的百花齐放,也带来了兼容性和生态破碎的问题。对于这一点,王少军博士坦诚是整个行业面对的难题,但同时行业也在努力进行标准化的建设。包括鲲云科技、浪潮等企业都在进行一些工作。“技术难度很大,需要一些时间,”王少军博士表示。
对于未来,鲲云科技一方面将持续发挥高效能、高性价比的优势,另一方面则将视野扩展到智能系统上,“不再是单纯的着眼于AI芯片部分,”王少军博士表示:“我们的目的是实现整个算力系统的最优,用户在场景应用上的性价比最高,成本最低。”
文章来源于互联网:鲲云科技王少军:打造高算力性价比的专用AI芯片
相关推荐: 《南方电网公司“十四五”大数据发展专项规划》发布
日前,《南方电网公司“十四五”大数据发展专项规划》(以下简称《规划》)发布。作为公司数字化转型和数字电网建设领域发布的第一个专项规划,《规划》全面回顾总结了公司“十三五”大数据发展取得的成绩,深入解读了数据生产要素、新基建、新型电力系统、数据安全法等国家战略及…