发布时间: 2017年09月07日
当地时间9月2日,华为首个人工智能移动计算平台——“麒麟970”(Kirin970)在德国柏林国际消费电子展(IFA2017)横空出世。这在展会现场引来巨大关注的同时,几乎也让处在地球另一端的国内业界沸腾,而相关行业媒体更是纷纷报道——大家有理由如此兴奋,因为此刻谈论的可是全球首个“AI Inside”的手机芯片,是人类第一次将人工智能计算单元嵌入到手机芯片这样的方寸之间。
麒麟970最吸引人目光的当属其核心人工智能处理单元——为移动端AI设计的计算架构 NPU(Neural Network Processing Unit,神经网络处理器)。这种独立的NPU不容小觑,在处理图像识别等人工智能任务上,NPU的性能密度大幅优于CPU和GPU(图像处理单元)。
人工智能在近年“大火”以来,将专门用于进行AI相关计算的处理单元嵌入手机芯片系统(SoC),是国内外许多芯片厂商梦寐以求的,甚至苹果公司曾宣布将推出“Apple Neural Engine”(苹果神经计算引擎)来应对未来移动端的AI应用需求。没想到,这一次来自中国的华为走在了前面。
全球首个AI inside手机芯片
与寒武纪联系密切
于半导体芯片发烧友而言,麒麟970有许多闪光点值得玩味:采用台积电(TSMC)10nm制程工艺,方寸间集成55亿个晶体管,功耗降低20%;配置华为自研升级的相机双ISP(图像信号处理单元),支持人脸追焦、场景检测;采用先进的4.5G LTE技术,支持全球最高LTE Cat.18通信规格,实现了业界最高的1.2Gbps峰值下载速率……但最为瞩目的,还是首次加入功耗更低、超高性能密度的NPU。
谈及NPU对于手机AI计算任务的提升,华为技术有限公司高级副总裁、消费者业务群CEO余承东在发布会上自信满满:相较于四个Cortex-A73核心,处理相同AI任务,NPU计算架构拥有约 50 倍能效和 25 倍性能优势。
更直观一点的感受是,根据华为内部测试结果,在没有NPU时麒麟970每分钟能处理97张图像,而集成了NPU后的处理速度是每分钟2005张图像。
凭借这样的表现,NPU可以称得上是支撑麒麟970智能计算的大脑中枢。
而更为人们津津乐道的是,此番华为得以先人一步在手机SoC上部署NPU,与AI芯片领域的新锐独角兽公司——寒武纪科技不无关系。
华为发布麒麟970之初,许多人就开始想象低调的华为是如何在短时间之内生长出将AI计算单元集成到手机芯片上的能力。紧接着,从中科院计算所流出的一封对华为发布麒麟970计算平台的贺信让情势明朗起来:
“……我所企业寒武纪公司研制并具有自主知识产权的‘寒武纪1A深度学习处理器’是国际上首个商用深度学习处理器产品,在人工智能应用上达到了四核CPU 25倍以上的性能和50倍以上的能效此次,麒麟970芯片集成寒武纪1A处理器作为其核心人工智能处理单元,实现了手机上本地、实时、高效的智能处理……”
这封贺信在记者所在的一个计算相关讨论群组一经发布后,群内纷纷对寒武纪公司表达赞叹之意,而记者的微信朋友圈内也出现不少类似信息,其中不乏来自计算所一些接近寒武纪团队的科研人员。当《中国科学报》记者就此向寒武纪科技创始人、CEO陈天石求证时,他表示“现在还在保密期,要到10月下旬才能公开”。而巧合的是,首款搭载麒麟970的华为Mate10手机也是在10月下旬(16日)面向全球发布。
强强联合
这一次中国芯技术领先
事实上,围绕 AI 任务进行专有加速的芯片有很多,但无论是谷歌 TPU(张量处理器)还是英伟达新一代Tesla V100 GPU加速器,都是为服务器端进行设计的,而在移动端对于机器学习任务加速的芯片封装还未出现。华为这款移动端 AI 芯片麒麟 970,正是填补了这一空白。
而华为麒麟970上的NPU封装,基本已坐实是与寒武纪强强联手的结晶,这也意味着,填补了移动端AI芯片这块空白的是真正的“中国芯”。
“华为麒麟970的出色性能显示我国在芯片上真是越来越强大,这种能力证明了底层核心技术,中国已经居于世界前列。”中国通信业知名观察家、飞象网总裁项立刚在接受《中国科学报》记者采访时说。
“寒武纪公司的技术产品受到了学术界和工业界的认可,在此我也相信,是寒武纪和华为的强强联合,将人工智能带入终端,经过几年的发展,定能给我们的生活带来改变。”中国科学技术大学计算机系一位要求匿名的在读博士生在接受记者采访时说,NPU这种性能提升可以让此前很多无法在移动端使用的机器学习应用走向工程化和实用化。
“搭载寒武纪1A的华为麒麟970芯片是全球首款移动AI芯片,而且是基于最先进的10nm工艺,图像识别性能是iPhone7 Plus的5倍,三星S8的20倍。可以说真正地强强联合打造了全球领先的技术。”中科院计算所副研究员鸿雁(化名)对该芯片的应用充满期许:“这款芯片将用于华为Mate 10手机,拭目以待。”
移动AI时代到来
尚需培育人工智能中国芯生态
清华大学微纳电子学系主任、中国半导体行业协会集成电路设计分会理事长魏少军曾公开表示:“人工智能芯片只有进入手机,才真正能够获得新生。如果只给互联网企业用,一定没有量。所以不解决进入手机、家庭(的问题),人工智能芯片没有希望。”
中国工程院院士、中星微电子有限公司董事长邓中翰也曾在接受《中国科学报》记者采访时表示:芯片是人工智能技术发展的源头,可谓“得芯片者得天下”,能否开发出具有超高运算能力、符合市场需求的芯片,是人工智能领域各路豪强争霸的关键。
而今,有了芯片,下一步是什么?陈天石的答案是:生态。
寒武纪CEO陈天石过去在接受记者采访时曾一再提到:“芯片的成败,除了本身的效率之外,生态是非常关键的环节。没有配套的应用和软件,很难在市场上获得成功。”他透露,这也是他们下力气推动国产AI指令集的原因:“只要国产AI指令集立住了,中国主导世界AI产业的机会可能就到来了。”
有业内人士认为,华为和寒武纪的合作,对构建国内企业的AI生态提供了重要的参考价值。该专业人士表示,在龙头企业数量和企业研发能力方面,中美两国还有一定的差距。人工智能芯片业态可能是实现换道超车的机会,但真要实现起来还需要更多国内企业共同参与、共同努力。
华为对AI生态的构建持开放态度。在发布会上,余承东表示:“用户需求推动科技进步,应用场景促使AI发展。麒麟970作为人工智能移动计算平台,我们将开放给更多的开发者和业界合作伙伴,提供完善的多应用模式和机器学习框架的支持,共同推动移动AI时代的到来。”
在余承东看来,人工智能手机芯片需要“芯”“端”“云”协同,才能发挥最大效用。“个体智慧的充分发挥离不开群体智慧的有力支持,人工智能也一样。”
而看到华为与寒武纪的强强联合,项立刚也对中国芯产业保持乐观:“华为发布了麒麟970,在河北云谷(固安)的第6代AMLOED生产线也封顶了,这条生产线可以生产供9000万部手机使用的柔性屏,可大大提升国产屏的占有率,打破日韩在这领域的垄断。日韩在配件产业的兴起,是手机整机业发展为基础的,相信随着手机整机业的发展,在CPU、存储芯片、摄像模组、屏幕这些核心配件上,中国企业会加大投入,未来5年下一代技术会成为争夺焦点。外国企业面对这种竞争只能降价,最后被挤压。中国企业会越来越掌握主动权。”