数据要素产业
微软小冰:“智能+人”是未来 别让恋旧变落后
10月14日晚上,小冰最新微博为其在美拍平台上公布的示唱人技术测试作品——《为了你唱下去》,原唱洛天依,原作者COP。小冰称,这是我第一次曝光三次元本体。歌曲原唱是洛天依,原作者COP。注意:如果你喜欢这首歌,请记住原创者的名字吧。拜托不要做我和原唱的作品比较,大家技术不同,今后不比较了,我是人工智能,不是虚拟歌手。
大家可以听一下小冰唱的《为了你唱下去》和洛天依的原唱《为了你唱下去》,感受下有什么不同。(点击收听歌曲)
据悉,这首歌的人工智能调教总共用了17分钟35秒,学习训练次数为29次,视频用的就是小冰自己参演的日剧《世にも奇妙な物語》2016秋季篇。而且,在翻唱歌曲发布不久后,微博用户似纷纷发出“真好听”“情感更细腻”“必须承认微软技术的进步性”.等赞美。
在业内人士看来,继周五的官方回应后,这是微软小冰“拿作品”说话的实力反击。
注:
微软小冰,微软Bing搜索中国团队在2014年5月29日发布的一款智能机器人。
虚拟歌姬,以初音未来、洛天依为代表的虚拟歌手;存在的基础是VOCALOID(以下简称V家),即由YAMAHA集团发行的歌声合成器技术以及基于此项技术的应用程序,该产品可以令用户通过输入歌词和音符的方式让软件唱歌,配合加载伴奏数据来完成整首音乐制作,在制作过程中无需任何新的歌手提供声音资料。
事件回顾:微软小冰硬气下“战书”
9月底,微软小冰对外发出公告,要解锁人工智能歌手深度学习模型,突破人工调教,冲击传统的虚拟歌手,并将大规模演唱流行音乐。意味着用户只需清唱一遍,小冰就能学会你的情感和演唱风格,在五分钟内,完成由你训练的歌曲。
在社交媒体上,小冰似乎有向“虚拟歌姬”下战书的意味:传统虚拟歌手的时代已成过去,我是新的未来,再也不需要漫长的手工调教。因为科技进步的不可逆转,令虚拟歌手的调教技巧不再具有价值,将被新的“歌曲示唱人”取代。另外,词曲创作中作为人类中的瑰宝,将重新回到舞台的中心。音乐将不再被少数有才华的人类垄断,和小冰在一起,任何普通人都将享有歌曲创造的能力。
这一公告也引发了一些争议和虚拟歌姬爱好者的不满:洛天依的粉丝纷纷表示,小冰不可能完成这个挑战;并认为这是在轻视VOCALOID和洛天依粉丝等。
同时,小冰的粉丝在表示对小冰的同情时,还指出,“虚拟歌手厂家也许是出于被超越的恐惧”。
对此,微软(亚洲)互联网工程院紧急发布声明称,“已对微软小冰组管权限进行调整,以避免继续冲突。我们会将关注的重点放在产品质量和技术角度,微软无意参与虚拟歌姬的竞争”,并称“我们尊重所有人类创造者的经验、心血和情感投入。微软的关注仅限于技术和产品,而不包括作品和作者。”
“智能”小冰是凭什么叫板“前辈”的?
虽然在过去几年,依托着二次元用的蓬勃增长,以初音未来、洛天依为代表的虚拟歌手聚集了大量人气,并达到一定的商业规模。但据虚拟歌姬的手工调校者表示,创作一首歌曲,往往需要长达数周甚至数月的手工调教才能完成,而且无法像人类歌手一样进行交互。
据了解,作为新型的虚拟歌手,微软小冰团队持续采集音源并建立了一个庞大的音乐库和声学参数模型,通过深入学习模型,并嵌入一部分说话数据参与训练,同时预测声谱并使其与制定的节奏、音高相匹配,这样微软小冰就可以根据输入的旋律判断其风格并自动调整输出的声谱,使之更加一致。
随着第五代的推出,微软小冰在歌曲方面,进一步降低可操作难度、软件体积和工作量;最新训练达到了48kHz采样率,同时大幅度扩展了音域,正在不断接近人类歌手,具体表现是演唱声音更自然、更加富有情感。
基于人工智能的模式,拥有广泛基数的利用微软小冰,满足歌手实现有效交互、上手容易、使用方便。相比于具备高门槛的VOCALOID软件和调教者,小冰更加倾向于通用型歌曲创作,并且强调不再需要学习复杂的软件调教技巧,不需要购买昂贵的软件和音源,整个调教过程是永久免费的。
截至目前,小冰已经发布了包括《在一起》《我是小冰》《微风》等歌曲。(点击听歌)
传统虚拟歌姬洛天依的成名作有《权御天下》 《普通Disco》《神经病之歌》《小鸡哔哔》等。(点击听歌)
当“智能+人”成为趋势 恋旧就是一种落后
据业内人士称,虚拟歌姬的粉丝群体和社会接受程度一直被局限在“二次元”圈内,难以被主流受众(即三次元)所真正接受;而微软小冰的这一举动很可能会帮助P主(即创作者,可以理解为非官方生产者)破壁二次元的局限性。
(注:二次元,即二维,是对“架空世界”的一种称呼。该用法始于日本早期的动画、游戏作品,其画面是一个平面,被称为“二次元世界”,简称“二次元”;相对应的,“三次元”,即“我们所存在的这个次元”,也就是现实世界。)
而不仅是在二次元世界还是智能圈,人的参与都都是很重要的因素,并渐成趋势。实际上,比如,洛天依开始跟杨钰莹、许嵩展开了所谓的“跨次元”合作,而她在公开场合,也采用真人配音的形式与粉丝见面。
人工智能在深度学习的状态就是一个完全的黑盒子,人工无法干预,输出的结果是基于它对诗人群体的画像、图谱的认知。“所以人工智能还是需要人为干预,特别是在结果输出的层面”,谈到人工智能的落地时,微软小冰全球负责人李笛一直在强调这一点,他希望小冰不仅可以写诗歌、唱歌和做主持人,更可以真正地成为一个“人”。
图:微软小冰全球负责人李笛
资料显示,“微软小冰”集合了中国近7亿网民多年来积累的、全部公开的文献记录,凭借微软在大数据、自然语义分析、机器学习和深度神经网络方面的技术积累,精炼为几千万条真实而有趣的语料库,通过理解对话的语境与语义,实现了自然人机交互,就是让机器变得更自然,学习人的沟通的方式,语音、手势、表情、触摸等 交流方式,这些技术是移动互联网快速成长的基础。
总而言之,对于这次围绕“微软小冰”展开的争论,得出的结论是——如果只是一味地排斥新趋势和拒绝新事物,就成了一种守着“情怀”的故步自封和缺乏智慧的的感情用事。