数据要素产业

AI同传PK人类同传，这或许是两个职业

12-08 00:46

TAG： AI AI同传

图片来自“123rf．com．cn”

人工智能又又又摔了个跟头。

今年的博鳌亚洲论坛上，第一次出现了AI同传。值得注意的是，这是博鳌论坛创办17年首次采用人工智能同传技术。然而，在如此重要的场合，现场配备的腾讯AI同传却掉了链子。词汇翻译不准确、重复、短语误用等“乌龙”引来各方“嘲笑”。

人们总是把AI跟人类职位对立起来，各种“取代论”层出不穷。博鳌论坛会议前，就出现了许许多多的“取代论新闻”引起了各界关注。最终，AI同传“翻车”，引来外界一片唏嘘。

然而，就目前来看，AI同传前路未明，太早将其与人类同传对立起来实在是“杞人忧天”。除了取代，AI同传其实有更好的路。

图为AI同传内容

AI同传进阶之路：变智能问题为数据问题

很多人都觉得人工智能如果要处理自然语言，就必须理解自然语言。实质上，AI翻译靠的是数字，更准确地来说，是统计。AI同传出错，并不是“智能”不够，实质上，是数据和模型出了问题。

AI同传还需要理解力

首先，AI同传要去理解场景。在博鳌论坛上，会议现场专业度高、覆盖度广，AI对特殊场景的理解还不够。场景对于语义具有至关重要的影响，相同的一句话在不同的场景里有不同的意思。举个例子，“好”这个字在百度汉语显示有多种语义，既可以表示称赞，也可以表示状态，还可以表达问好……诸如此类，语义的表达和理解都要结合具体的场景。在具体的句子中，这种语义与情景的结合就更为紧密，更需要机器理解学习。

其次，AI要理解口语的模糊逻辑。口语翻译是不会百分百传译的，根据AIIC（国际会议口译员协会）的规定，同传译员只要翻译出演讲者内容的80％就已经算是合格了（90％～100％的“同传”几乎是不可能的）。这意味着AI工作量减少吗？当然不，正是这种模糊的东西使得AI同传更加困难，除此之外，口语没有标点符号来标志句子，缺少了必要的声调和停顿，就很容易造成句子的歧义。而模糊的指令极有可能出现的是满屏的错码。

隐马尔可夫模型（HMM）解决统计数据之外的语言问题

然而，在参考腾讯AI同传的失误后，我们发现，仅仅增加数据量还是不够的，在现实生活中，我们也会遇到零概率或者统计量不足的问题。

比如一个汉语的语言模型，就足足达到20万这个量级。曾有人做过这样一个假设，如果刨掉互联网上的垃圾数据，互联网中将会有100亿个有意义的中文网页，这还是相当高估的一个数据，每个网页平均1000词，那么，即使将互联网上上所有中文内容用作训练，依然只有1013。

为了解决数据量的问题，我们提出了隐马尔可夫模型（HMM）。实际应用中，我们可以把HMM看作一个黑箱子，这个黑箱子可以利用比较简洁的数据，处理后得出：

1．每个时刻对应的状态序列；

2．混合分布的均值和方差矩阵；

3．混合分布的权重矩阵；

4．状态间转移概率矩阵。

看起来可能比较复杂，简单点说，这个模型可以通过可观察的数据而发现这个数据域外的状态，即隐含状态。也就是说，我们可以凭借一句话，来探索出这句话后的隐含的意思，从而解决一些微妙的语义问题。

如上图所示，这个模型能够通过你提供的可以明显观察的句子，推断出一个人隐含的心情状态（开心OR难过），并得到最后的行为判断（宅、购物、社交），即通过已知推断出未知。

而如何优化这个模型，得到最优隐含状态？人们提出了许多解决问题的算法，包括前向算法、Viterbi算法和Baum－Welch算法。此中奥妙，难以尽述。但不能否认的是，在深度学习的基础上，数据＋模型就能很好地打造出一款AI同传翻译，数据越大，神经网络更好。即使翻译结果不尽如人意，但只要建设足够大的数据库，建立更好的模型，打磨算法，AI同传很快就会有更大的提升。

NLP金字塔顶端反哺底端：打造高质量AI同传

除了增加数据库和打磨数据模型，AI同传还可以从哪些方面提升呢？我们不妨借鉴一下其它的技术。下图中，这四个方面代表了人们在NLP领域的一些进步。用金字塔形来表示这四个技术之间的关系，难度是逐级上升的。

目前，聊天机器人和阅读理解这一块儿已经取得了很大的突破。而AI阅读理解技术的进步不止是NLP的高阶进化，还有一层意义是，科学之间是相通的，技术之间可以互相借鉴，金字塔顶端技术可以反哺底端。

在自然语言处理上，人区别于AI的点在于人有先验知识。即人们在听到某个字时，会自然地联想到后一个字，或者会被一个词触发了一句话的联想。比如，我们听到“中”，既有可能想到“国”，也可能想到“间”。但是AI“联想”的词却依靠数据。它说“北”，如果输入的数据不变，那后面跟的就是”京“。

智能相对论行业分析师颜璇曾经在《AI在阅读理解领域开始“跑分”，这个“人类好帮手”还能去哪炫技》一文中总结了AI阅读理解的技术层面，我们或许可以从中得到阅读理解技术反哺AI同传的方法。

AI阅读理解技术的流程如下，em bedding la yer（相当于是人的词汇级的阅读知识）→Encoding la yer（相当于人通览全文）→Matching la yer（相当于带着问题读段落）→Self－Matching la yer（相当于人再读一遍进行验证）→AnswerPointerla yer（相当于人综合线索定位答题）。

综合来看，阅读更偏向的是Multi－turn，即做完一次输入输出后，要把结果作为下轮输入的一部分继续输出，系统在运作时需要考虑上下文。而翻译，则是Single－turn，一句话进一句话出。

合理利用后，机器翻译即使现在是Single－turn，将来也有可能是Multi－turn；AI同传现在没用到上下文背景，将来也有可能结合上下文做到翻译质量更佳。

如今，创作还是人工智能正在摸索的领域，而一旦这个领域有了突破，将一些技术应用到AI同传里，我们或许可以达到翻译的最高境界——”信、达、雅”。

在未来，AI不会挤占人类同声传译员的空间

AI同传会取代人类翻译吗？当然不会。先不说语言本身的复杂，我们可以来看看同传的实际应用场景。

在实际工作中，不论是口译还是直接对话都需要同传来完成，不会有被服务方只聘用其中的一个职能。也就是说，AI同传不仅要学会翻译，还要学会聊天。而在这一块儿，机器还有很大的进步空间。那么，AI同传的用处在哪里呢？

AI共享同传，仅针对普通人的市场

人们出国旅游，常常会遇到语言沟通问题，然而，并不是每个人都配得起一个专业的口语翻译。这时候，如果一个可穿戴设备亦或者一部手机就能为你同声传译，想必会减少很多人的出国成本。随身携带一位专属的同声传译，是不是觉得很酷呢？

智能硬件一直是AI的狂热地带。就在去年，微软和华为合作，在Mate10手机中嵌入了微软的神经网络机器翻译，可以算得上是在终端运行神经网络机器翻译的第一例。

如果AI同传的硬件设备出世，更可能的商业模式是出租或者共享。即按需求进行租用，有一个专门的技术公司负责租赁，正如共享单车一样，我们的使用费会降到极低。而这类AI的应用场景并不在复杂的会议现场，而是日常生活，出外旅游等，语料库的建设也会更加简单。

如此，AI同传只是更加惠民而已，却不会取代在某个特殊场景比如金融会议、医疗会议等更加专业的人类同传。

将AI同传与硬件设备相结合，创造切实可用的语音接口，还可以在很大程度上提高用户在移动终端、可穿戴、智能家居、智能汽车等智能设备的体验，真正在交互层面实现智能时代的人机结合。

AI同传成为同声翻译的考官

同声传译需求量成倍增加，但是合格的同声传译的数量却增长非常缓慢，据了解，现实市场上能够十句话翻译出十句的同传译员寥寥无几。同时，拥有高级口译资格证书的人并不一定能胜任同声翻译，同声翻译还需要进行专业的技能训练，而有些合格的同声翻译人员也并不一定有口译证书。

目前，我国还没有一个固定的机构来负责同声翻译的相关事宜，也没有一套统一的标准对同声翻译的工作进行考评。

面对这样的困境，我们或许可以在AI同传上开个脑洞。

人们可以利用AI数字化、标准化等特点，以数据库为依托，将AI训练成单一功能性的考核机器，针对不同的应用场景，对同声传译员进行考核和评级，从而规范人才市场。

这里或许可以参考驾驶培训机器人。驾培机器人包含了高精度GPS导航技术、惯性技术和虚拟传感技术、视频检测、数据处理、无线传输、指纹身份识别等高新技术，能够精确记录、判断驾驶人操纵驾驶机动车的真实能力。

同理，AI同传也可以在各种场景里，去观察、判断考生的翻译能力，以及考生对翻译规则的熟悉、理解程度。这个系统可以减少考试员的劳动强度和人为因素，确保考试公平、公正，考核方法科学准确。

简单来讲，我们的目标是通过智能机器，使考核自动化，选拨或者是训练真正的人才，而并非取代人类的翻译能力。更有意思的是，在考核过程中，AI又能不断吸收新养分，增加口语类文本语料库，何乐而不为呢？

更多>数据要素产业相关信息

最新发布

点击排行

Select Language

AI社区

今日排行

本月搜索

Dataset Category

数据要素产业

AI同传PK人类同传，这或许是两个职业