数据要素产业
人工智能的下一个挑战:理解语言的细微差别
语言是人类特有的技能,是人类智慧的体现。在人工智能时代,自然语言处理(NLP)技术为机器赋予了这样的语言功能,让机器有了自然语言识别能力,为用户体验开辟了新路径。
在近期的Google Cloud Next 18大会上,Google推出了第一个Solution Product (行业解决方案产品)——Contact Center AI,其集虚拟助理、智能信息发掘和情感分析等功能于一身,不但帮助工作人员有效解决了问题而且提升了用户体验,展现了人工智能语言技术的新突破。貌似科幻小说里的场景变成了现实,但是想要维护好人与机器的关系,机器必须能够实现直观的、自然的语言交流,这对于NLP技术来说仍然是一个挑战。很多企业早就开始研究NLP,该项技术的出现几乎跟人工智能一样早,但是目前还处于起步阶段。
语言是人们进行信息交流的首要工具,要想机器也具备同样的机制,就要理解人类语言的复杂性以及人类使用语言的行为习惯,其中情感分析、问题回答以及多任务学习是机器人逐渐成熟的重要途径。
情绪分析
语言本质上是复杂的,一个正常人也要经过数年才能掌握一门陌生的语言。对于机器人而言,我们要想使用人工智能来解析给定的陈述,首先要实现情绪分析,比如,判断电影评价是正面的还是负面的,或者分析发话者是高兴的、生气的、惊讶的还是悲伤的等。从客户服务到在线社区审核再到算法交易,企业能够通过分析成千上万个推文或数百个产品评论,了解公众对产品的看法,对于企业来说,这个价值是很大的。
研发人员早就开始入手自然语言处理中的情绪分析,随着NLP的进步,情绪分析也在不断进步。比如CRM解决方案提供商Salesforce推出的一款产品——Einstein AI(爱因斯坦人工智能服务),它可以帮助客户对电子邮件、社交媒体聊天文本进行情感分析,然后了解用户信息,帮助确定企业客户的下一步产品策划。
Salesforce的首席科学家 Richard Socher表示,机器人只实现简单的语意理解是不够的,有时候需要一定的语境,需要通过联系上下文去判断。比如,你是一个生产肥皂的企业,用户在产品评价上说了这样一句话“这款肥皂真的很适合婴儿!”。按照表面的语意来说,可能就是对产品的积极评价,但是如果联系上下文,整个语言环境都是对产品的差评,那么这句话的意思也可以理解成“这款产品真的很差劲!不要给婴儿使用!”。所以,NLP真正的挑战是在特定的语言背景下,去理解语言的细微差别,即需要通过简单的标记数据改进模型训练,也需要能够联系上下文在多种不同任务中共享知识的新模型。
问题回答
NLP的发展加快了信息化的速度,Siri和Google Assistant等应用程序的出现,解决了很多常见的自然语言处理问题,但是很多难题,机器仍然没有给到我们想要的答复。
想要计算机到达理想效果,我们还要确保计算机对问题的理解。如果你问“我的飞机何时到达?”电脑需要知道你说的是飞机的航班还是你从外地订购的某个飞机模型,它需要通过上下文语境,去猜测我们话语中的真实意思。通过NLP,我们可以让机器学习如何通过上下文语境去分析语句,这样的话,人工智能就可以一次性处理所有的上下文,而不会漏掉重要的信息。
多任务学习
在IT领域,企业更擅长构建单个任务的人工智能模型,但是一个更直观的、细致入微的、有语境的对话界面则需要一个不断学习的人工智能模型——将新的任务和旧的任务集成在一起,来学习执行更复杂的任务。对于别的领域来说,人工智能达到这样的标准也许是可能的,但是在语言方面,就需要很大的灵活性。
这里我们来举一个例子:“谁是我的客户?”,这是一个足够简单的任务。但是“谁是我在西部地区的某一产品的最佳客户?”现在,我们增加了一些复杂条件,就需要一系列集成任务来回答这个问题,比如说:“最佳”如何界定?西部地区的客户具体是哪里?哪些因素会使客户对一种产品产生兴趣?这里我们在查询条件里增加了一个项目,问题的复杂性就显著增加。
Salesforce Research最近创建了自然语言十项全能,利用问答的力量在单一模块中解决NLP中最棘手的10项任务:问答、机器翻译、摘要、自然语言推理、情感分析、语义角色标注、关系抽取、目标导向对话、语义分析、常识代词消解。使用多个任务问答模型,将每个任务作为一种问答形式,单个模型在没有特定参数或模块的情况下共同处理不同的任务,这不仅意味着研发人员不需要为每一项任务构建、训练和优化模型,而且还意味着该模型将具备zero-shot(零样本学习)能力,也就是说,在未经过任何训练的情况下该模型也可以处理它从未执行过的任务。
Socher解释道,问题回答其实是非常宽泛的——你可以随便问任何问题——该研究相当于提供了解决几个任务的单一模型。
虽然目前的NLP还处于起步阶段,但是我们可以看到它巨大的发展潜力,随着人工智能的发展,我们期待一个全新的自然语言处理技术体验。