在不久的将来,如果你看到两个“眼镜男”面对面热切交谈,却各自说着不同种类的语言,不要惊讶,他们很可能是佩戴了具有智能翻译功能的VR眼镜。这种眼镜可以将对方说出的话即时翻译成自己可以理解的语言并显示出来。
智能翻译VR眼镜,这正是字节跳动旗下火山翻译正在进行的一项产品研发。10月26日,在主题为“智算·新际”的2021人工智能计算大会(AICC 2021)上,字节跳动AI LAB机器翻译负责人王明轩为媒体记者展开了一副智能翻译的未来画卷。
字节跳动AI LAB机器翻译负责人王明轩
依托字节体系 成就百亿量级AI翻译引擎
经过近10年的发展,字节跳动拥有了抖音、今日头条、抖音火山版等一系列爆款产品,同时也积累了丰富的场景解决方案和底层技术能力。为了将这些能力对外赋能,字节跳动了推出了面向企业业务的数字化中台——火山引擎以及一系列中台产品,火山翻译便是其中之一。
王明轩介绍,从品牌角度看,火山翻译可以看做火山引擎的子品牌。火山翻译承载了对内、对外两个方向的使命。对内是通过AI翻译支持字节跳动产品及业务,对外则通过企业业务将字节跳动的AI翻译能力赋能给需要的企业。
字节跳动业务场景差异极大。火山翻译不仅仅要面对100多个国家地区各自的官方语言,还要面对各式各样的方言,需要解决语言问题非常复杂。此外,包括抖音在内的字节跳动产品形式丰富,包含了视频、语音、静态和动态图像等等,都需要做到准确、迅速的翻译。
“一个是多语言,一个多模态。”王明轩概括性地描述了火山翻译要面对的问题。他表示,解决了这两个问题的火山翻译产品具备了极大的通用性。火山翻译因此拥有了很深厚的技术积累,也形成了独有的优势。
据介绍,目前火山翻译每天处理的字符数据量达到了百亿级。为了提升实时业务场景的翻译效率,以及AI数据训练的效率,火山翻译自研并开源了一款业内最快的一个推理引擎(LightSeq)。在硬件方面,通过与浪潮等伙伴的业务合作,火山翻译很好地解决了在AI训练和业务场景中的算力需求。
“字节跳动本身的业务就非常具有挑战性,”王明轩表示,火山翻译是随着字节跳动的发展和需求成长起来的。因此,在对外赋能的企业业务中,火山翻译很少遇到复杂程度或者场景差异度超过字节跳动自身需求的情况,能够有效地满足外部企业客户的需求。
全场景赋能 打造多语言无碍互通体验
翻译准确性一直是评判翻译质量的核心标准。
“在某些场景火山翻译的质量已经超过译员的平均水平。”王明轩介绍,火山翻译的准确性从整体看能达到80%以上。虽然距离尽善尽美的100%还有一定距离,但相对于人工翻译的平均质量已经有很大进步。
此外,相比于人工翻译,机器翻译的特点是使用简便,成本更低且具有随时随地性。对于未来,王明轩认为人工翻译将会聚焦在头部小场景需求,而机器翻译将成为满足更广阔、更丰富场景翻译需求的主力军。
这些场景可能包括在线文本翻译、文字及图片识别、实时会议翻译、对话即时翻译等。要做到这些,显然已经超出了“翻译”的范畴。
因此,火山翻译从本质看,是更多中台产品的一个集合体。这其中包括语音识别、TTS、图像识别、视频识别等中台能力。在字节跳动内部,将这些中台能力称为“原子能力”,意即不可分的最小能力。
“务实”,是王明轩对字节跳动一系列研发活动的看法。过去数年中,字节跳动开源了很多有影响力的代码、模型、数据,贡献了多篇前沿论文,并荣获ACL2021最佳论文。同时,在实际的场景应用中,包括火山翻译在内产品不断根据用户反馈进行迭代和改进,确保产品功能的最佳。
“我们要确保每一项原子能力都做到最好,最后他们整合在一起的解决方案才是真正经受得起考验的。”王明轩表示。
文章来源于互联网:火山翻译王明轩:百亿量级AI翻译引擎打造全场景多语言互通体验
相关推荐: IDCC2021上海站 | 罗格朗详述“双碳”政策下数据中心的建设和运维
10月13日,IDCC2021上海站将在上海万达瑞华酒店召开! IDCC2021上海站由中国IDC产业年度大典组委会主办、中国IDC圈承办,以“赋能高质发展 开启低碳未来”为主题,相关部门领导、产业专家、行业精英等多位大咖将受邀出席,共同探讨数据中心行业实践、…