数据要素产业
智能手机AI的下半场 从扁平到立体
自去年以来,手机行业最热的名词必是“AI”无疑。AI,即人工智能,英文Artificial Intelligence,又称机器智能(Machine Intelligence)。顾名思义,这是机器展现出来的智能,区别于人或动物的自然智能(Natual Intelligence)。
AI作为一个新技术被世人知晓,可能是源于两年前。彼时,谷歌的人工智能棋手“Alpha Go”战胜围棋世界冠军李世石而一战成名,人们开始了解到AI并寄予这项技术更多的遐想:AI是否是生产力革命的下一个“风口”?而在科技行业中,嗅觉灵敏的手机行业当然希望牢牢抓住AI这一风口,将这一技术由前端科研下放到消费电子领域,应用到智能手机终端。AI终究更快地走入了人们的生活。
目前看来,AI在智能手机上的应用,分为上半场和下半场。
上半场:
自2017年9月2日首款AI手机芯片麒麟970芯片正式发布,支持到硬件级的AI能力进入到手机行业,正式开启智能手机AI化的上半场。在这个时间区间内,手机的应用主要是各个手机厂家在推动,零散,分裂,水平参差不齐。由于手机厂商的研发投入与技术底蕴各不相同,自然对AI的真实性与可用性也不一而足。
时至今日,AI技术已经从理论开始产品化实践,进而向消费电子领域全面普及。在手机行业中,上至旗舰,下到千元机,无论是拍照还是玩游戏,整个行业渴望抢食AI红利,乃至AI手机从拥有技术底蕴的公司辛勤研发的“风口”变成哪怕不具备能力的厂家希望能靠营销上位的“风噪”。
首先是华为、苹果等厂商,凭借专门的AI硬件与软件的配合实现了完成度较高的AI功能,促进了行业的发展和进步。例如华为在硬件上采用麒麟970/980等具有独立NPU的AI芯片,软件上通过集成了AI识别场景、AI翻译等功能的EUMI系统来实现AI功能,方便了用户的使用。在过去的一段时间里,似乎安卓阵营只有华为和荣耀有底气讲自己的产品是名副其实的AI手机。
另一方面,有一些厂家,则单单凭借一些软件算法,就称自己的手机为“AI手机”,甚至一些千元机,也是张口闭口“AI拍照”“AI游戏”。但归根结底,他们鲜有技术积累,遑论实现真正的AI功能,自然无法让用户感觉到手机变得更加智能;甚至在一定程度上加大了手机行业营销过度的“风噪”声量。
那么这里就引入一个问题,所谓的“手机AI”,到底是什么呢?
简单来说,手机AI就是用专门的AI芯片识别特定场景并针对性地完成任务。具体的实现原理则是以AI芯片对神经网络模型进行深度学习,进而在自然语义理解,图像识别等场景下工作。
可以理解为,AI的本质是运算,当前手机芯片AI运算解决方案主要以独立处理单元体现。其中独立处理单元则是在手机处理器中加入深度学习专用处理器IP。我们熟知的传统处理器和图形处理器一般是面向特定部分的应用,不具有向深度学习方面的优化计算能力。而专门进行AI计算的专用处理器则能够显著提升深度学习的处理速度和能效,提升能效比。
目前在端侧,手机AI最常解决的场景在人脸识别、物体识别、图像分割、智能翻译等场景。举个例子,你在使用手机拍照时,手机能自动识别蓝天、人像、动物这些具体场景,从而针对不同场景进行不同优化,都是图像识别、图像分割这些看似“高端”的技术的落地。而对于AI,其性能也并非“看不见摸不着”。而在苏黎世联邦理工学院的AI Benchmark测试中,麒麟980获得了目前安卓手机中的No:1。而在比较经典的AI测试场景中,苹果A12 Bionic每秒能识别6000张照片。
因此,在近半年发布的A12 Bionic、麒麟980,以及三星Exynos9820中都加入了独立的神经网络处理单元,主流移动芯片厂商对于自家的旗舰终端芯片,标志着上游供应链已经完成了硬件上对AI的支持。(在下个月高通发布的8150中,据说也会搭载独立NPU)
从华为开创移动端人工智能芯片的先河,到如今几乎所有的主流旗舰级芯片都加入硬件级AI的支持。如果说单个手机厂家自己做AI只是自发的行为,以致于各家所能实现的AI水平参差不齐;那么全体芯片厂商从上游的芯片供应来推动手机AI的发展,就使得硬件级AI将覆盖未来几乎所有的高端旗舰智能手机。至此,智能手机AI的上半场告一段落。
下半场:从扁平到立体
尽管得到了上游芯片厂商的支持,但也只是标志着手机AI军备竞赛的下半场将正式开始。因为当大家在硬件层面都处在同一起跑线的时候,竞争会变得多样化。
如果说手机AI 1.0是二维平面,单纯依靠智能手机的终端硬件——AI芯片来在端侧实现;那么如今手机AI 2.0的时代业已成为一种三维的通路:面对日益复杂的AI工作场景,需要从芯片、终端再到云端进行协作运算。在这方面,华为的HiAI平台则跑在了前面。
首先,芯片硬件的AI算力是实现AI功能的物质基础,AI算力的强弱决定了智能手机执行AI任务的速度。
以风靡全球的Prisma软件为例。作为第一款结合了人工智能技术的滤镜软件,一经问世便走红全球,它的特点在于将用户的照片赋予梵高的《星空》等经典大作的风格。其实现原理就是AI中的“卷积神经网络”学习,在用户选择要添加艺术滤镜的原照片后,Prisma软件便开始了“物体识别--纹理合成--风格提取--图片合成”这一系列的工作流程,这其中最难的工作就是物体识别。
在一张集成了错综复杂的线条、色彩与光影的照片中,如何较为精准地区分出物体的轮廓?这就回到了卷积神经网络技术,通过不断的训练与学习,一步步地对目标图片中物体进行“筛选”和“过滤”,最后就会得到较为清晰的物体轮廓,进而用算法生成与经典画作一样风格的照片。因此在进行AI任务,如用Prisma软件修图时,拥有不同AI算力的智能手机表现也会有显著的差距。华为麒麟980等集成独立NPU单元的Soc对于卷积神经网络运算的支持更加到位,这是由于卷积神经网络在运算时需要进行大量的并行计算。相比依赖CPU等进行AI运算的芯片,具有独立NPU的芯片有着4倍的速度与仅仅1/50的功耗。
其次,AI功能的落地离不开软件的支持。华为在软件上打造了一个完成度非常高的AI闭环。从打开手机开始,用户可以使用系统层面的智能情景助手和智能语音助手小艺;打开相机,可以用AI摄影大师进行场景识别并自动优化拍摄参数;打开AI识物可以识别食物的卡路里、搜索看到的商品或者进行即时翻译,等等……用户随时随地都在使用着真实可感的AI服务。
另外,随着对于复杂AI工作场景的不断开发,必然要实现终端(智能手机)到云端(服务器)的协同计算。因为硬件本身的算力毕竟是有限的,只有借力于云端服务器,才能实现更好的AI运算。
譬如当用户将镜头对准一只不知其种类的小狗,终端和云端的AI接力开始。终端芯片凭借NPU迅速地识别镜头下小狗的各种特征,首先识别出它是一只狗,但可能储存在手机内部的算法并不知道具体是一只什么狗。此时云端存储的不同品种小狗的特征进行对比和校验,最后在屏幕上显示出小狗的准确种类让用户了解,这只是一个很小的AI协同工作的场景,但举一反三,未来在手机会做出更多令人期待的功能。
因此在华为HiAI 2.0中,开发了基于 “芯、端、云”三层AI生态,HiAI Foundation芯片能力、HiAI Engine应用能力与HiAI Service服务能力,以芯、端、云结合的三层开放能力满足开发者的各种需求。在未来,更多成熟的AI应用一定是有赖于完善的AI计算与开发平台。打通芯片(硬件)—系统及APP(软件)—云端(计算)这一完整的通路,才能实现更好的AI功能。
总结:
如今的智能手机行业显然已经到了一个关键的十字路口。处理器性能的单纯提高和硬件上的进化,在过去的十年里充当了这个行业主要的任务,而在这些基础性能之上,如今AI已经成为智能手机通向未来的一把钥匙,在算力和数据的马太效应之下,会加速智能手机AI的进化速度。对于智能手机来说,随着上游芯片厂商的推动,AI的上半场已经逐渐尘埃落定,而下半场,哨音已响。