数据要素产业
百度重磅发布“AI输入”开启全感官输入时代
不久前,百度输入法在北京举办了主题为“AI输入,开启全感官输入时代”的发布会。会上,百度副总裁AI技术平台体系(AIG)总负责人王海峰出席并为大会致辞。随着AI技术进步,进一步渗入到输入法中,百度AI输入开启了全感官输入时代的序幕。
百度AI输入
百度副总裁AI技术平台体系(AIG)总负责人王海峰在大会致辞中指出“随着AI的到来,全感官输入时代的序幕已经拉开。”
输入法本质上是一种人与机器交流的媒介,也是用户高频使用的重要工具。纵观历史,随着技术的发展,人与机器交流的媒介和形式也在不断变化升级。随着语音、手写等输入方式的出现,输入法也几经变化,而真正为输入法带来质的突破的,是AI技术。
百度从诞生之日起就已经和AI息息相关,而百度输入法是百度AI的重要产品,也是百度AI技术率先落地应用的产品之一,王海峰在大会中用“AI技术应用的桥头堡”形容百度输入法的价值所在。基于百度领先的AI语音技术,百度输入法实现了又准又快的语音输入,并支持多语种、场景化、长语音、轻声识别等功能创新,这些功能应用在实际场景中,将实实在在改变用户生活。
全感官输入时代的序幕已经拉开,未来将会有更多AI能力应用到输入法中。
一项技术突破,两大全新功能
此外,作为此次发布会的亮点之一,百度语音技术部总监高亮,在大会上发布了百度语音技术的最新突破——Deep Peak 2模型。该技术全称为“基于 LSTM 和 CTC 的上下文无关音素组合建模”,该模型突破了沿用十几年的传统模型,能够更充分地发挥神经网络模型的参数优势,大幅提升中英文、多种口音、多种风格(如朗读、聊天、轻声)混合输入的识别准确率,聊天场景下的相对正确率较行业领先水平提升20%,让机器更轻松适应用户的自然对话。
同时,百度输入法负责人蔡玉婷在大会中宣布了百度输入法v8.0版本的正式上线,该版本在此前已有的AI功能上增加了“语音速记”和“AR表情”两大全新AI功能。
其中,“语音速记”在输入法领域独家首发了“声纹识别”技术,该技术针对2-3人小型会议场景,可根据声纹自动区别发言人,实现智能化的语音识别。而“AR表情”功能基于百度领先的人脸识别技术和 AR 技术,用户不仅可根据相机或相册进行人脸识别、制作表情包,还支持用户通过自己的表情控制虚拟人物形象。制作出来的AR表情,可以直接通过输入法搜索、语音输入和键盘输入时展示出来。
百度输入法 更懂你的表达
当AI技术深入落地输入法,其所加持的各种功能让它已不再仅仅是“输入工具”。
当记者面对人物采访时,百度输入法语音速记功能高效、精准的记录,可帮助记者进行实时记录,从而提升了记者的工作效率,弥补了传统手记在速度上的滞后。也避免了事后需要听打来整理录音的不便。
此外,游戏主播在直播过程中,也可利用百度输入游戏键盘开黑。不仅有极简语音功能可令其节省打字时间,更有诸如便捷短语、和谐转换等功能可为主播门进行定制化服务,丰富其游戏体验感。
而对于外国人来说,用百度输入法还有内置翻译功能。在线交流中,遇见不懂词汇可直接用输入法来实时翻译,避免的不同APP间跳转的繁琐,消除了交流障碍,方便其日常沟通和学习。
科技发展,AI时代近在眼前。百度在不断发展AI技术的同时,更注重让技术落地于实践、服务于生活。百度输入法未来进一步革新人机交互模式,完全开启全感官输入时代的日子指日可待。