数据要素产业
讯飞系语音app体验:简直是国货之光!
科大讯飞的名字和他们推出的产品,相信各位小伙伴都已经耳熟能详了。小黑之前做过的阿尔法蛋早教机器人也正是他们的产品。
从阿尔法蛋早教机器人上,小黑可以看出科大讯飞在软硬件设计上的优秀实力。不过要小黑说,硬件对科大讯飞来说还不是真正拿手的方向,他们的软件调教能力,才真正让小黑吃惊。
最近,小黑偶然间发现了两款出自科大讯飞之手的应用:讯飞有声和讯飞语记,这两款应用拥有十分优秀的语音能力,也能够成为我们日常工作、学习中的好帮手。
讯飞有声,让每行字都发出自己的声音
小黑之前做过一期关于讯飞彩屏阅读器的测评视频《Kindle劲敌出现,讯飞彩色屏会击垮“泡面神器”吗?》,在视频中,小黑提到了讯飞彩屏阅读器拥有的语音读书能力。
而讯飞有声则是科大讯飞出品的一款文字转语音朗读应用,有了它,我们甚至可以把任何一款手机、平板都变成“讯飞彩屏阅读器”。
▲ 4.9分的评分还是相对较高的
小黑自然不会因为用户评分高就给出自己的好评,还是那句老话,是骡子是马咱得牵出来遛遛。
其实,讯飞有声app的UI设计并不太符合现在主流的设计风格,而是停留在iOS 7以轻线条为主的设计风格上。
▲ iOS 7的图标设计采用大量细线条勾勒图标轮廓
而讯飞有声app在界面配色上似乎还要更“粗糙”一些。
这样的界面布局和配色,让小黑在一瞬间产生了一种“我是不是还在用2010年的手机网页”的错觉。
当然,设计并不是衡量一款应用的重要标准,毕竟讯飞有声app的功能布局令人一目了然。在首页中,我们可以清楚地看到应用的主要功能模块:编辑朗读、复制朗读、图片朗读和网页朗读。
看来,讯飞有声app的语音朗读功能还是非常丰富的。
讯飞有声app的另外四个页面分别是收藏、内容推荐、书城以及个人账号的功能。
收藏和个人账号这两个功能页小黑就不介绍了,毕竟基本上每个拥有内容生态的应用都会有这两个页面。对了,虽然这类应用也都会有发现页,但讯飞有声app中的发现页倒不只是内容推荐。
在发现页的上半部分,我们可以看到四个主要的功能入口,分别是wifi传书、有声号、睡前听和随时听。
睡前听和随时听这两个功能其实就是内容推荐,因此按下不表,而wifi传书则让小黑想起了几年前从电脑传电子书到手机上的操作:在电脑端浏览器打开某个链接,之后把电子书拖到浏览器里就可以通过Wi-Fi传书到应用里了。
而有声号的功能则类似红板报或ZAKER这类信息聚合类应用。用户可以在其中订阅自己想要收听的内容,并且根据小黑的体验,这些有声号大多还是值得订阅的。
▲ 左侧是讯飞有声app中的有声号,右侧是红板报app
不过,有声号的知名度和热度显然不能和红板报相比,对知名创作者的吸引力也差之甚远。
好在丰富的外部内容输入朗读功能和听书页中的书城功能都可以弥补内容的不足。在听书页中,iPhone手机可以通过三种方式将书籍导入应用,而Android手机则可以直接将手机本地文件导入。
▲ iPhone端支持三种方式导入电子书
当我们切换到书城标签后,还可以直接搜索公众号文章、有声号和小说。
可惜的是,可能是微信公众号的开放端口所限,搜索结果并不完全让小黑满意。例如,当小黑搜索之前的文章《手机里隐藏的秘密,不看真的会后悔!》,得到的结果却与小黑想要的大相径庭。
当然,阅读微信公众号文章毕竟不是讯飞有声app的长处,因此我们也不必太苛求。
搜索中的小说资源基本都是中国古代的文史著作,而现当代作品和国外作品,小黑基本没有发现。
▲ 讯飞有声app中的书籍资源基本都是中国古代著作
从上面这些方面可以看出,讯飞有声app在资源丰富度上还是有些不足。
语音读书能力哪家强?真实语音看出高下!
鉴于科大讯飞的长处还是在语音方面,因此小黑觉得最重要的,还是对陌生内容的阅读能力。
在这款应用的介绍部分,我们可以看到这样的描述:
很显然,讯飞有声主打的,是语音的自然度。
恰巧,在国内还有两大厂商拥有自己的语音合成技术团队,也都运用在各自的小说阅读应用中。
其中之一,就是微信读书。虽然在微信读书的网页和应用中都没有找到语音技术提供方的信息,但小黑在腾讯AI开放平台的老版本网页中,还是在语音合成页的合作案例中,找到了微信读书。
因此,小黑有理由相信微信读书app中的AI朗读功能是由腾讯自己的团队提供的。
另一个应用则是百度旗下的百度阅读。根据小黑在百度智能云官网上搜索到的资料来看,百度针对不同场景和用户需求,开发了非常多不同音色的语音版本。
▲ 百度智能云提供了非常多的音色可供选择
那么,讯飞、腾讯、百度的三个语音技术团队推出的AI朗读功能孰优孰劣呢?小黑决定挑选同一本书,各自录一段AI朗读的语音来做对比。
其实吧,小黑倒是觉得这三个应用的中文AI朗读能力都还是能听出不少机器感的。
相比之下,讯飞有声略自然一些,但语速较快。而百度阅读的AI朗读很明显能听出想“装”成人声但伪装失败的感觉(还有吞字的状况)。至于微信阅读的效果则介于两者之间。
讯飞语记,真的能让记录更简单吗?
不仅在AI朗读能力上,科大讯飞有着强大的实力,在语音输入、转换文本方面,科大讯飞一样实力不俗。
通过讯飞语记,我们也可以体验到它的语音转换能力。
▲ 讯飞语记app的主要功能
在讯飞语记app的教程文档中,我们可以看到它的一些主要特点:不仅能够直接将语音和文字互相转换,同时还支持随声翻译和OCR识别功能。
应用的界面相比讯飞有声app更加简洁。首页展示的是已制作的笔记。
点击中间的加号按钮,则可以选择要添加笔记的方式。
在讯飞语记app中提供了四种记录功能:录音速记、语音输入、文字识别和外部录音的转写。
录音速记功能可以简单地理解为会议录音功能。在这个功能中,应用会同时将对话内容进行录音并同步转化成文字,不论是文字编辑还是内容检查,都非常方便。
▲ 录音速记功能可以在录音的同时转文字
并且,从上面这个简单的案例中还可以看到,讯飞语记app还支持中英文混合输入。
不过,有些功能需要开通VIP才能获得更好的体验,如一分钟以上的录音转写、高精转写等。
外部录音转写则支持从手机或电脑中导入录音,使用也非常方便。
▲ 讯飞语记支持多种方式导入音频
可惜的是,这一功能也需要付费才能使用,因此小黑也就无法测试它是否好用了。
好在语音输入功能也可以为我们展示它的语音识别能力。作为对比,小黑选择了Noted这款在语音转录方面知名度较高的应用,来对比它们的语音转录能力。
▲ 左边是讯飞语记的转录结果,右边是Noted
小黑随意选择了一句中英文混合的文章标题,来模拟国内用户在工作中的习惯,结果,两者的差别还是比较大的。
在支持的语言上,Noted确实更国际化一些,连一些小语种都可以获得语音转文字的功能,但在国内常见的对话场景下,它的表现并不能让人满意。
▲ Noted支持不少小语种的语音转文字
而讯飞语记app中,除了个别文字误识别成音近字,基本都可以准确识别出来。
可以看出,讯飞语记依然保持着科大讯飞在语音相关能力上的强大实力。
对于这几年非常流行的“国货之光”一词,小黑始终没有太大的兴趣。特别是许多品牌只需要靠炒作就可以被冠以这个称号,让一些支持民族企业的消费者直呼上当。
不过,科大讯飞倒真配得上“国货之光”这样的称呼,不论是硬件产品如早教机、彩屏电子书,还是应用程序如讯飞输入法、讯飞有声,都给我们带来了不错的使用体验。小黑也希望,这样专注研发的民族企业能多一些,让我们的民族品牌真正站上世界的舞台。
图源:应用内截图、百度搜索