Select Language

AI社区

数据要素产业

“哦豁”!会说四川话的天猫精灵来了,配音女娃月薪十万

12-08 01:06 TAG: 人工智能 天猫精灵 四川话

“嫩个特别哩你,让小喵特别崇拜”。4月23日,阿里巴巴旗下的人工智能助手天猫精灵宣布,今天起可以开口说四川话了。用户在使用闹钟、天气、你想我猜等日常生活及娱乐功能时都可以用四川方言对话。

学说四川话,阿里花费大精力

随着人工智能等技术的快速发展,语音识别的准确率大大提升,被广泛应用于智能音箱、智慧电视以及智能驾驶等领域。但就目前而言,大多数的语音助手能会听、会说的还只是停留在普通话方面,一直以来,方言对于语音助手都是很大的挑战,为了能让天猫精灵“学会”普通话,阿里可是花费了大精力。

“哦豁”!会说四川话的天猫精灵来了,配音女娃月薪十万

图片来源:OFweek维科网

从2019年3月开始,阿里举办“四川方言大赛”,招聘四川话“声音模特”,经过三个多月的比赛、筛选,最终一位95后成都女娃周玥偲获得冠军,阿里以700元一小时的高薪招聘这位成都女孩“教”人工智能产品学说四川话,光是录制声音就花了1个月的时间。最后,周玥偲拿到了1个月10万元的高薪报酬。

由于四川方言博大精深,而且四川跨区域大,不同片区之间有口音差异,各地的口音、词汇都略有不同,给模型训练带来高难度。为了让智能音箱能够听懂不同地区的四川口音,过去一年中,还有数万用户主动参与“教你说四川话”技能,为研发提供了宝贵语料。

据介绍,教会这只“四川猫”并不简单,除了录制声音,研发主要应用了两种技术,四川方言ASR语音识别技术和TTS语音合成技术,前者用于理解方言语言,后者则用于模仿真人口音语调。此外,研发团队采用了阿里自研的语音建模技术,进行方言口音适配。

目前天猫精灵已经可以进行大部分日常沟通,甚至还能用四川话喊麦、说笑话、背古诗、念童谣等,最近网络上流行的“惊雷”,天猫精灵都可以演绎出来。

据悉,天猫精灵四川话版本正在逐步上线,调教过“四川猫”的用户可以优先获得四川话服务,其余用户则可参与APP端的四川话考试获得尝鲜名额。到5月底,所有用户都可以拥有这只“四川猫”。

毫无疑问,对于一款语音助手来说,说一口“地道的本地话”是一件很困难但却很受欢迎的事情,就目前来看,在“会说方言的”智能音箱这一点上,阿里算是是走在前列,在行业内又拥有了一份优势。

低调成立的阿里人工智能实验室

在2019中国国际智能产业博览会(简称“智博会”)上,参展的阿里巴巴展示了可识别四川方言的智能音箱“天猫精灵”,这正是由阿里巴巴人工智能实验室开发。此次天猫精灵能够学会四川话,背后也离不开阿里巴巴人工智能实验室的长期技术积累。

2016年,阿里人工智能实验室成立,到2017年7月5日才首次公开亮相,正式发布旗下第一款智能语音终端设备便是“天猫精灵X1”。

阿里人工智能实验室从成立之时就非常低调,当时连官网都没有,唯一从网上看得到的是该实验室在大量招人,具体是谁负责外界也不得而知。直到现在百度百科上,有关阿里人工智能实验室的资料也是少之又少,但是这也抵挡不住其闪耀的光芒。

2019年9月,云栖大会上,阿里人工智能实验室在发布会上宣布,天猫精灵销量连续两年中国第一、全球第三,目前天猫精灵X1是全球销量最大的中文智能音箱产品。另外精灵联盟可连接的AIoT设备达到了2.35亿台。

在此次大会上,阿里巴巴第一颗自研AI芯片“含光800”正式问世,。由达摩院算法加持,该芯片在业界标准的ResNet-50测试中,推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍。

人工智能留下“多彩乡音”

中华文化博大精深,华夏文明源远流长,中国大地上有着许多广泛使用的方言,这些方言是中国语言文化的瑰宝,不仅是人们乡情的根系,还是传承丰富的历史文化内涵。但是随着经济、社会的飞速发展,这些拥有地域风情的方言面临着消失的风险。

2019年,阿里巴巴人工智能实验室宣布,正式成立方言保护专项小组,投入1亿元人民币对汉语方言进行保护和开发。

各种汉语方言在语法语音上的特征都不相同,很难被系统整理,而且归纳完整的语音变化、进行句法和语义分析等工作难以单靠人力完成。如果利用人工智能技术建立不同方言的数据库,系统地对方言文字、发音等进行整理,将会对方言保护和研究大有帮助。

据阿里巴巴人工智能实验室高级产品专家张平介绍,做方言是为了让更多地域人群能更好地交流,同时也更多保护地域文化,而且适配不同的方言识别,对整体语音识别技术也会是一种促进和优化。

至于为什么从四川话开始,张平表示,“我们第一款先做四川方言,就是因为四川方言在中国方言中用户占比大”。

利用人工智能加快推进方言保护,为世界留下多彩乡音,‘四川猫’迈出了用科技保护文化的万里长征第一步。

写在最后

此次天猫精灵上线四川方言,不仅可以满足老人、孩子这一类不会说普通话,或是不习惯说普通话的用户实际需求,也能够让人工智能助手更具备特色,一口熟悉的“乡音”能够快速拉近亲切感,让其成为家庭一员。

而且,独具中国特色的“方言版”语音识别产品还有助于中国企业开展差异化竞争,继续挖掘方言的价值,促进其保护和传承。