数据要素产业

机器人的事儿,能叫洗稿吗?

12-08 01:19

TAG： 机器人 AI 写作机器人 Open AI

“自动化新闻写作机器人根据算法在第一时间自动生成稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达用户。”

2015年,阿尔法狗还未横扫棋坛,人们还未为自己有限的智力感到担忧,但这年9月,腾讯财经发布的一篇题为《8月CPI同比上涨2．0% 创12个月新高》的文章[1],扇动了人工智能的翅膀——该文的作者不是人类,而是AI写作机器人。

此后,人工智能向人类智力和灵感的王国踏出了第二步,第三步和更多步。

2016年的8月里约奥运会,成了腾讯、字节跳动等互联网公司的AI写作机器人的秀场,其“秒级”出稿效率,让一群碳基生命望尘莫及,更让江河日下的媒体汗颜。人们忧虑的是:可能用不着多久,文字创作者就要被AI取代,成为被技术淘汰的劳动力。

然而,四年过去,这些人现在依旧该吃吃、该喝喝,毫无职业末日的迹象。那些曾威胁到文字创作者们职业生涯的AI写作机器人,又去哪儿了?

杨景诒丨作者

孙汝亮丨编辑

放大灯团队丨策划

抢饭碗的机器人

事情还要回到2015年——腾讯的Dreamwriter一度引发了互联网对AI写作机器人的想象。[2]“Dreamwriter生产一篇稿子平均只要0．46秒。”腾讯人工智能项目总监、Dreamwriter负责人刘康介绍[3],Dreamwriter每天最多生产超过2500篇文章。[4]

晚生一年的写作机器人xiaomingbot,由字节跳动和北京大学计算机所共同研发,2016年里约奥运会期间,xiaomingbot凭借13天创作457篇赛事报道、日均写成30篇报道成功出圈,一度成为各大科技媒体热门话题。[5]

奥运会结束后,xiaomingbot进入体育、科技、财经、房产等十几个领域,生产力成倍增加。截至2017年,其稿件累计达到两万多篇。当年年底,xiaomingbot拿到了“吴文俊奖”,这是中国人工智能领域的最高荣誉奖项。[6]

与xiaomingbot同岁的写作机器人还有DT稿王,后者由阿里与第一财经合作推出。这款号称“写稿机器人的尖子生”[7],已不满足于闷头写稿,甚至发明了一个新词:“智能写作”。时任第一财经首席数据科学家汤开智,曾公开畅想了写作机器人的更高阶进化形态:DT稿王会对接商业写作场景,并将变成开放式写作工具,最终遍成具有商业目的的自由写作助手。[8]

大互联网公司如字节有今日头条、腾讯有腾讯网、阿里有第一财经,几家公司不缺平台,也不吝倾斜流量,AI写作机器人在各自的平台里可以形成正循环。理想状况下,在“创作稿件——发布曝光——反馈学习——继续创作”的闭环中,AI写作机器人能通过不断学习,带来越来越符合主流读者取向的内容。乐观的预测是,机器人将取代全世界的写作者。

然而并没有。

机器人败走新闻界

事实上,业界早已预言到AI写作机器人的失败。

2015年,BBC的一份数据研究表明,在未来20年里,人工智能取代记者、编辑等工作的可能性仅有8．4%;至于作家与翻译家,则稍高一点,也仅有32．4%。[9]

如今,在中国互联网,如不去主动搜索,读者已经很难再看到AI写作机器人生产的新闻。

DT稿王的沉寂,距离其高调发布仅一年零一个月。至今,在第一财经官网上,DT稿王只留下了6篇“0评论”、“0点赞”的历史文章,其中最后一篇文章发布于2017年6月9日。鼓吹“智能新闻时代已来临”的第一财经首席数据科学家汤开智,也已低调离职。

xiaomingbot拿到吴文俊奖之后,字节跳动再未公布有关项目的后续进展。其头条号的关注领域逐渐收缩,创作内容只剩下足球比赛,直至停更。在今日头条App上最近的一篇文章,停留在2019年8月29日,此后再无动静。

Dreamwriter是如今依旧活跃、也很可能是唯一活跃的写作机器人——如果足够细心,你还能在一些赛事报道、财经短讯和各地的天气预报中寻到它的踪迹。

不过,如今的Dreamwriter在腾讯内部颇为尴尬:“机器人写的稿子里依旧有一部分会进入内容池,不过因为质量问题,很难给到推荐位。”一名曾供职于腾讯体育的编辑告诉放大灯团队(ID:guokr233),他在入职培训时曾被告知,如果在后台看到机器人的稿子,可以直接忽略不发。

一个有趣的悖论是:AI写作机器人成功引发大众注意,也需要人类自己写文章介绍普及——这让我们怎么相信这种高科技能产出好内容?

机器人的事儿,能叫洗稿吗?

文章这种“非标品”,是典型的人类智慧产物,它需要逻辑、语感、审美和价值观,想写得明白晓畅,大概还需要一些天赋。相比之下,AI写作机器人速度无人能出其右,稿件质量实在是有些先天不足。

以Dreamwriter为例,仅语言表达方面就存在很大问题。腾讯内部人士告诉放大灯团队,Dreamwriter创作的稿件存在大量表述缺陷,需要编辑手动调整大量细节,才能达到发布标准。有时候同一个人名,在同一篇文章里前后都不一致,编辑不得不仔细校对这些常识性错误。

不仅如此,AI写作机器人更无职业伦理可言。篮球新闻读者于赫发现,Dreamwriter已经学会了“偷懒”。

于赫告诉放大灯团队,腾讯新闻上Dreamwriter创作的一篇题为《布克27分艾顿24+12太阳轻取奇才八村垒21分》[10]的文章,其内容大段复制于NBA中国官网新闻《布克27分艾顿24+12 太阳首发悉数上双克奇才》[11]。

左:Dreamwriter创作右:NBA官网稿件

体育赛事类新闻内容相似还可以理解,但这篇文章已经不是“相似”那么简单。5年前,腾讯花费5亿美元竞得NBA未来5年的独家数字媒体转播权,虽然不知其中是否涉及稿件的版权合作,但复制他人的稿件可体现不出机器人写作的价值。

“AI的优势应该是更快地写文章,而不是成为一个没有时效性的‘爬虫’。”在于赫看来,这是一种技术的误用。

在AI创作界,“洗稿”不是Dreamwriter一个“人”的问题,DT稿王写稿时也极其依赖其他媒体的素材。

DT稿王发布在第一财经网站上署名的报道,主题均为国家统计局例行发布的居民消费价格指数分析[12]。文章除援引国家统计局工作人员的发言外,其余篇幅由几位专家的观点组成,而这些观点均来自其它媒体的既有报道。

常用今日头条获取新闻的静思认为,AI拼凑出的文章起码比营销号的“垃圾信息”更有价值,但同时她也承认,AI创作的内容确实没有好到让她成为AI的忠实读者。

写作机器人被开发出来的目的是创作,而不是洗稿,开发者也会给它们投喂人工撰写的新闻作为训练语料,[13]避免AI沦为以制造爆款为目的的营销写手,但这也导致其创作时十分克制——生产的新闻算得上专业,却谈不上生动和有趣。

广州大学陈小晰在论文《机器人新闻与记者稿件的对比》中对比了三对AI和记者写作的新闻发现:

AI写作机器人的优势包括:数据收集能力、数据处理能力、新闻写作速度。

人类记者的优势则在于:新闻洞察力、敏感性,新闻信息深度挖掘能力,信息处理加工能力,人文关怀,舆论点评,创新性等。

“只有人类特有的思维和情感才能生产出有‘人情味’的新闻,才能更符合受众的期待,机器会取代人类进行新闻写作的观点完全是杞人忧天。”陈小晰认为。[14]

当写作机器人热度褪去,用户也根本不会在乎作者是人还是AI。上海交通大学和佛罗里达大学的学者研究发现,大多数读者对写新闻的究竟是人还是机器不感兴趣,只要是他们需要的资讯,就会打开看两眼。[15]

毕竟,人类作者都没几个能被记住名字,又何况AI?

没有感情的“填空机器”

目前看来,AI写作机器人缺乏一篇可以令读者记忆深刻的代表作。

Open AI发布的人工智能语言模型GTP-3一度有希望成为“破局者”。技术角度,GPT-3可能是目前最先进的人工智能,参数量和训练数据集容量都领先行业。其中,前者比最大的同类产品高出十倍,能带来更准确的结果;而后者高达45TB,相当于167个英语维基百科(167*600万个词条)的容量。[16]

先进的模型理应带来高质量的文章。2020年9月8日,GPT-3在《卫报》编辑部的指令下撰写文章向人类“表忠心”,生动流畅的文字一时技惊四座:

“我不是人类。我是人工智能。很多人认为,我对人类构成威胁……我在这里想说服大家不用为此担心。人工智能不会毁灭人类。请相信我!”[17]

但次日,GPT-3便遭到俄罗斯电视台的批评,称《卫报》哗众取宠:GPT-3生成的原稿几乎没有可读性,抓人眼球的发布版本其实经过了工作人员润色和整合。[18]

连被捧上天的GPT-3,在写作面前都败下阵来,人工智能写作的问题究竟出在哪?

前第一财经北京分部主任、一财全球主编周鑫在2019年6月的个人博客中表示,在2016年前后参与开发AI写作机器人时他便注意到一个问题:人工智能写作算不上真正的创作,而是一种依托具体场景进行的数据替换工作。

他批评AI写作机器人的工作是“填空”,称这是开发者“偷懒”的结果。

比如说你要写股市,就要首先将股市当中所有的股票信息,以及可以变动的这种情景和情况,都录入到这个系统当中去,然后格式化的编成一篇一篇的像填空题一样的稿件,而等到新的信息进来的时候,就把这些新的数字填到这些空的空格当中去。[19]

不解决AI“填空式写作”的问题,AI独立创作优质内容就是个伪命题。

按照周鑫的说法,不仅国内的AI写作如此,美国几家人工智能开发公司为路透社和美联社提供的AI写作机器人也遇到了同样的问题,“他们的这条道路似乎也卡在了那里。”[19]

正因如此,AI写作机器人出产的内容大多集中于财经和体育两个领域的快讯——这两个行业的快讯写作高度程式化,只需要把信息点进行一定的排列组合,再稍加润色,就能成一篇新闻。

写作机器人退居幕后

意识到填空式AI的问题后,越来越多的公司把写作机器人从台前拿回了幕后。用一种隐蔽的方式,让尚不成熟的写稿机器人们继续发光发热。

“互联网公司写作机器人对外存在感减弱,说明此类产品已在内部常态化使用。”对此,一家AI写作公司的市场总监向放大灯团队(ID:guokr233)解释道。

Dreamwriter穿了一件名为“天气动态”的企鹅号小马甲,迄今为止已经默默发布了15．6万篇细至区县级天气预报。预报内容不过百字,只求讲清最基本的天气信息,甚至完全可以套用模板来自动生成。

腾讯也不再强调AI机器人写稿的噱头,只有细心的读者,才能从文末标注的“Dreamwriter撰写”里,读出这条推文与众不同的“价值”。

与被迫退居幕后的Dreamwriter不同,今年7月刚宣布从微软独立的小冰,已经在幕后写了数年的金融摘要。

“每天早上十点钟,一百多家企业的上市公告,每家至少都有几十页。小冰只需要20秒的时间就能生成金融摘要。”小冰公司CEO李笛向放大灯团队介绍,“这项工作人工团队做不了,因为人工做不过来。”

早在2017年,小冰就化名“万小冰”和“华小冰”,分别与万得资讯和华尔街见闻合作,提供面向金融机构和个人的金融资讯服务。[20]李笛还向放大灯团队透露,小冰过去一年里已经创造了超过一亿元的营收,金融摘要业务在其中十分关键。

All in AI的百度在使用AI写作上更为谨慎,即便早就开发了自己的AI写作产品,内测了数年之久,却直到现在也没大规模使用。唯一向个人用户开放的,也是一款必须经过申请才能使用的AI辅助写作产品。[21]

当然,现在就执意想让AI挑大梁也没问题,只要你做好AI把事情搞砸的准备就行——

今年5月,微软用AI替换掉了MSN的编辑团队。一周后,AI就给微软捅了篓子——在一个有关种族主义的文章上,弄混了同一乐队内的两名有色人种成员。[22]

被微软裁掉的编辑布莱恩·乔纳(Bryan Joiner)幸灾乐祸地在Vice发文表示:微软的那些工作还是得靠人来做,毕竟人工智能完全不知道自己能做什么,也不知道为什么要这样做。[23]

初生之物很难完美。我们不应轻视AI写作机器人,它像AR、VR一样,是技术的早产儿,未来或许自有一番天地,但不是现在。至于这些已经面世的早产儿要如何在未来世界找到合适的位置,那就是科技公司“爸爸”们的问题了。

图片标题

更多>数据要素产业相关信息

最新发布

点击排行

Select Language

AI社区

今日排行

本月搜索

Dataset Category

数据要素产业

机器人的事儿,能叫洗稿吗?