数据要素产业
一篇论文引发的光子AI芯片革命!这次真想要了摩尔定律的命
芯东西(公众号:aichip001)
作者 | 心缘
编辑 | 漠影
光子计算时代到来了吗?几家中美芯片创企正试图给出正面的回答。
2020年6月,LightOn发表用光学神经网络训练芯片运行AI模型的新论文;7月,曦智科技拿到由和利资本投资的数千万美元A+轮融资;8月,Lightmatter在芯片顶会HotChips上展示了其光子芯片的架构细节;12月,光子算数宣布其打造的光电混合AI加速计算卡已交予服务器厂商客户做测试。
在加速人工智能(AI)这条赛道上,光子计算芯片这条创新的技术方向正异军突起。这是一群勇敢的探路人,他们在期待和争议中前行,一步一个脚印地试图证明自己判断方向的正确性。
光子AI芯片距离产业化落地还有多远?在这一赛道的创业者们,能给计算芯片带来新的惊喜吗?
一、一篇顶刊论文引出的新型赛道
随着摩尔定律滞缓,硅光子技术成为超越摩尔定律的研究方向之一。
2017年,来自英国艾克塞特大学、牛津大学和明斯特大学的研究人员,宣布了其类脑光驱动芯片研究成果。他们用特殊相变材料和光子集成电路模拟人脑神经突触,使得这款芯片在测试中的数据传输速度达300Gbps,比当时现有标准处理器要快10-50倍,同时功耗大幅降低。
在同年5月的美国麻省理工学院10万美元创业大赛上,一支来自麻省理工学院(MIT)的团队凭借用纳米光子芯片执行AI任务,成功斩获大奖。
▲主创团队在2017年赢得麻省理工学院10万美元创业大赛
1个月后,主创团队的研究成果登上顶级期刊《自然光子学》的封面,论文描述了一种利用光学干涉进行神经网络计算的创新方法。当时,国际著名光学科学家、斯坦福大学终身教授David Miller评价称:“这一系列研究成果极大地推动了集成光学未来取代传统电子计算芯片的发展。”
这篇光子芯片论文的一作及通讯作者是MIT博士后沈亦晨,二作是尼克哈里斯(Nick Harris)。不久之后,这些论文合著者将成为商业上的竞争对手,开启各自的创业之旅,并分别获得来自谷歌、百度等科技巨头的投资。
▲麻省理工学院团队论文登上《自然光子学》封面
论文链接:https://www.nature.com/articles/nphoton.2017.93
光子是当前速度最快的粒子,相较电子,速度更快而功耗极低。此前光学技术通常应用于通信传输领域,借助光的更快速度、更高容量等特点实现数据的远距离传输,但在计算领域进展缓慢。
实际上,光计算的研究历史并不短暂。在国外,1950年代前后,贝尔实验室等机构花费大量精力来设计光学计算机部件;在国内,1987年中科院上海光学精密机械研究所王之江院士曾于《中国科学院院刊》上撰文,提出了极具前瞻性的发展光计算技术的建议,并于此后在光学神经学逻辑计算方面开展了大量的工作。
由于光计算的应用场景并不清晰,软硬件体系也不够完善,关于如何用光子代替电子芯片执行计算的想法长期停留在研究阶段,鲜少在实际应用中发挥广泛的作用。
直到摩尔定律趋于滞缓,AI的巨轮开始起航。
二、光子AI芯片的优势:速度快、功耗低、擅长并行计算
作为统治计算的一个基准法则,摩尔定律指出,微处理器芯片上的晶体管数每18-24个月翻一番,曾长期作为推动电子设备小型化和互联网普及的关键动力。
但这是芯片制造商及供应商竭力维系摩尔定律的结果,随着逼近物理尺寸极限、散热难题即将成为无法克服的挑战,以及许多关键的计算密集型应用发展提速,人们对摩尔定律的未来产生了更多疑虑,对芯片技术创新的需求也愈发迫切。
2016年,《Nature》在“超越摩尔(More than Moore)”一文中指出,摩尔定律已接近日薄西山,接下来硅晶技术的发展将不再以摩尔定律为中心,造出更好的芯片然后让应用跟进,而是从应用出发来看需要怎样的芯片支持,进而容纳更多细微复杂的创新方向。
而根据OpenAI发布的分析数据,自2012年以来,AI训练对算力的需求每3.43个月翻一番,增速明显快于摩尔定律。
▲自2012年以来算力需求增长超过30万倍,而如果以摩尔定律的速度只会有 12 倍的增长(来源:OpenAI)
随着以神经网络计算为主的AI应用普及,一些研究人员意识到,深度学习可能是数十年来光学计算所等待的“杀手级应用”。
首先,光速快于电子速度,理想状态下,光子芯片的计算速度能比电子芯片快约1000倍。同时,采用成熟半导体工艺技术的光子芯片,即可达到当下需要的计算能力。
其次,光子计算消耗能量少,同等计算速度下,光子芯片的功耗仅为电子芯片的数百分之一,可以缓解AI创新所需的数据中心建设对环境的影响。
▲Lightmatter联合创始人兼CEO尼克哈里斯在2020年Hot Chips上讲解光子计算相较电子计算的延时、带宽、功耗优势
最后,光计算技术具有并行计算的特点,光波的频率、波长、偏振态和相位等信息可以代表不同的数据,且光路在交叉传输时互不干扰。这些特性使得光子擅长做并行运算,与多数计算过程花在“矩阵乘法”上的人工神经网络相契合。
总体而言,光具有高计算速度、低功耗、低时延等特点,且不易受到温度、电磁场和噪声变化的影响,在AI应用领域,将光学技术与电子学结合,有望提供比传统方法更好的速度和能效。
三、光子计算走向商业化
嗅到AI加速带来的机会后,来自英、法、美、中的一些创业团队开始扬帆起航,切入云端AI计算市场,其中不乏有初创公司得到来自科技巨头及知名投资者的投资。
2013年成立的英国创企Optalysys,曾于2015年创建一个光计算原型,实现了约320Gflops的处理速度,且能效非常低。去年上半年,Optalysys推出了入门级光学协处理器FT: X2000,计划出售给包括计算机制造、国防及航空航天领域的部分合作伙伴及早期客户。
▲Optalysys入门级光学协处理器FT: X2000
初创公司Fathom Computing成立于2014年,其光子原型计算机在2014年时识别手写数字的准确率还只有30%左右,到2018年时已经超过90%。其创始人Willam Andregg称,这是机器学习软件首次使用激光脉冲电路而非电力进行训练。不过近两年,这家创企似乎并未公开更多进展。
2018年,成立两年、总部位于法国巴黎的创企LightOn宣布,它已经开始在欧洲的数据中心测试自己的光学处理单元(OPU)技术。2020年6月,LightOn发表的新论文显示,其光学神经网络训练芯片在运行基于MNIST手写数字数据集训练的模型时,学习率为0.01,测试准确率达到95.8%;同一算法在GPU上的学习率为0.001、准确率达97.6%。而该光学芯片的功耗效率要比GPU高出一个数量级。
论文链接:https://arxiv.org/pdf/2006.01475.pdf
当然,名气最盛的光子芯片创业者,当属曾在《自然光子学》上发表封面文章、来自麻省理工学院的沈亦晨和尼克哈里斯,两人均在2017年成立光子芯片公司,都选择Mach-Zehnder干涉仪光开关阵列(MZI)作为基础计算单元,但具体的MZI结构及阵列架构有所不同。
沈亦晨在美国波士顿创办Lightelligence,在中国上海成立曦智科技,发展了跨国多元团队,是目前全球融资额最高的光子计算初创公司。
▲曦智科技创始团队
曦智科技在2018年获得由百度风投和美国半导体高管财团领投的逾1000万美元种子轮融资;2020年4月完成由经纬中国和中金资本旗下中金硅谷基金领投、百度风投继续追加投资的2600万美元A轮融资;2020年7月完成由和利资本投资的数千万美元A+轮融资。
2019年4月,曦智科技发布全球首款光子芯片原型板卡,在运行TensorFlow处理MNIST数据集的测试中取得百倍以上的速度提升,准确率接近电子芯片(97%以上),而完成矩阵乘法所用的时间不到最先进电子芯片的1/100。曦智科技计划从2021年起为AI云计算带来高效的量产产品。
▲曦智科技开发的全球第一款光子芯片原型板卡
尼克哈里斯在波士顿创办的Lightmatter公司,则拿到了由谷歌风投、星火资本、经纬创投等投资的3300万美元资金。
▲Lightmatter联合创始人Darius Bunandar(左)、Nicholas Harris(中)、 Thomas Graham(右)
在2020年的芯片顶会Hot Chips上,Lightmatter展示了其用于AI推理加速的测试芯片Mars,该芯片利用硅光电学和MEMS技术,通过由毫瓦级激光光源,为用光执行矩阵向量乘法提供动力。相较传统电子芯片,其计算速度提升数个量级。
Lightmatter预计在2021年秋季推出这款测试芯片的首款商用产品,并为之打造了必要的软件工具链。哈里斯称其量产芯片在BERT、Resnet-50推理等工作负载上,能效将是AI芯片领导者NVIDIA旗舰芯片A100的20倍、吞吐量将是A100的5倍。
▲Lightmatter测试芯片Mars
看到《自然光子学》上MIT团队刊发的论文后,正在研究光电子的中国北京交通大学2014级博士生白冰获得了新的启发,他与十余位来自清华、北大等北京8所高校的博士生们一起,在2017年在北京创立光子算数团队,开始推进光子AI芯片商业化。
▲光子算数创始人兼CEO白冰
光子算数于2018年9月获得臻云创投、英诺天使基金投资的天使轮融资、2019年获得由水木清华校友基金、常见投资、英诺天使基金、臻云创投等投资的A轮融资。
目前光子算数已研发可编程光子阵列芯片FPPGA(Field Programmable Photonic Gate Arrays),并基于此与北京高校一起打造了面向服务器的光电混合AI加速计算卡,能完成包括机器学习推理、时间序列分析在内的一些定制化加速任务。
其计算卡已于2020年交由服务器厂商客户进行测试,在不到70W的运行功耗下,能做三四十路1080P视频同步处理,混合精度下峰值算力接近20TOPS,光部分为低精度,电部分为高精度。
▲光子算数的光电混合AI加速计算服务器应用测试
从美国普林斯顿大学脱胎而出的美国光子AI芯片创企Luminous Computing成立相对晚一些。
该公司由首席策略官Michael Gao、CEO Marcus Gomez和CTO Mitchell Nahmias在2018年联合创立,于2019年筹得来自微软创始人比尔盖茨、Uber首席执行官Dara Khosrowshahi等知名投资者的900万美元种子轮融资,2020年又筹得由Helios Capital领投的900万美元A轮融资。
Nahmias在普林斯顿PhD期间的主要研究方向即是光子AI芯片。与MIT团队不同,他们采用的并非MZI,而是被称为Broadcast and Weight的方案,相较MZI型方案多了光电转换过程,且对相位不敏感。Nahmias称其光子集成电路可以取代3000块TPU板,更加节省能耗,且能突破现有AI芯片传输数据的瓶颈。
▲Broadcast and Weight方案的原理框架
这些创业团队的硬件均被设计为可以插入标准服务器和工作站中,可实现即插即用,并能与主流AI软件配合使用,以满足商用需求。
结语:光子计算踏上AI计算新征程
训练AI模型需要超高算力的计算机芯片,这使得芯片巨头、初创公司之间展开一场围绕AI计算的全新角逐。
如今光子计算仍处早期阶段,站在这一全新计算赛道上的玩家们,几乎没有前路可以借鉴,他们正顶着技术挑战、落地风险等方面的压力,试图构建起光子计算生态,探索着改变计算的可能。
对于投资者来说,新兴计算技术仍充满风险。但随着世界对多元计算方式的需求增加,以光子计算、神经拟态芯片、量子芯片等为代表的新兴计算方法,正被寄予打破标准计算系统制约的期待。
这是件令人期待的事情,光学计算已经在商业化道路上迈出了重要的一步,而一旦有初创公司解决工程化挑战、取得落地商用的成功,光学计算革命的大门或将由此开启。
参考资料:《光子芯片研究进展及展望》世界科学;《MIT初创公司发布全球首个光子AI芯片原型!独立光学计算硬件,庞大系统成功集成至常规板卡|独家专访》DeepTech深科技;初创《光子AI芯片新玩家Luminous Computing》光学小豆芽;《Alphabet invests in a start-up using beams of light on chips for super-fast A.I.》CNBC