数据要素产业
谷歌推出反应速度更快的语音助手,或将打败SIRI和ALEXA
人们经常向Siri和Alexa这样的语音助手打招呼,让语音助手来服务自己,但是语音助手可能会反应很慢,而且这种体验可能也会时不时地出现故障。
周二,谷歌展示了一项新技术,该技术能显著提高语音识别的响应能力,这表明语音识别可能很快就会让人无法抗拒。
在山景城的年度开发者大会上,谷歌吹嘘其语音识别软件缩小到其先前尺寸的1/25。首席执行官Sundar Pichai称这是一个里程碑,因为它意味着云服务器中的软件可以安装在Pixel智能手机中,使系统能够更快地响应一个人的声音。
在星期二的一系列演示中,谷歌展示的手机可以在发出声音时识别文字,而不是将音频发送到远程服务器。更快的响应速度可能会改变人们与手机的关系。在所示的一个场景中,谷歌的虚拟助手比Siri等竞争对手显得更加强大。
在该演示中,谷歌员工梅吉·霍林格(Meggie Hollinger)展示了她如何能够通过一系列语音命令轻松地在手机上完成工作。而且每一项都比Siri更快地完成。
为了向朋友发送最近一次假期的照片,霍林格只说了两句话,三个短语:“给我看黄石公园照片,有关动物的,把它发给贾斯汀。”几秒钟之内,谷歌的照片应用程序搜索了她的收藏夹,并且显示出一只野牛的照片。
谷歌人工智能首席执行官杰夫迪恩在推特上表示这个语音识别功能会改变你与手机互动的方式。
现代语音助手是2012年人工智能研究的产物,这表明深度学习技术可以使语音识别更加准确。谷歌表示,该技术将错误率降低了25%。但是,向云端发送音频会限制速度,并由于网络错误而产生故障。
谷歌花了数年时间研究如何缩小深度学习软件,并在2019年将其语音识别模型降至一个很低的门槛。
该公司周二表示,最新版本的谷歌云端服务器语音识别软件包的大小约为2千兆字节,而且可以在智能手机上运行。
语音识别明显比第一代基于云的深度学习技术快得多,可能会促使用户更频繁地使用语音命令并查询。它还可能使谷歌的设备和服务比苹果和亚马逊等竞争对手更加强大。
Gartner的研究主管Werner Goertz称,转向语音设备识别可能会改变游戏规则。这可能是苹果和亚马逊更传统语音系统面临的重大挑战。
谷歌还利用其技术为其未来的手机Live Caption创建了一项新功能。激活后,屏幕上会显示手机上播放的任何语音的字幕,例如来自朋友的视频或播客。由于是在手机上进行的,因此即使在飞行模式下也能正常工作。