数据要素产业
陈根:AI辩论最新进展,接近人类专家
文/陈根
比尔盖茨曾说:“语言理解是人工智能皇冠上的明珠”。
其中,自然语言处理(NaturalLan-guageProcessing,NLP)是将人类交流沟通所用的语言经过处理转化为机器所能理解的机器语言,是一种研究语言能力的模型和算法框架,是语言学和计算机科学的交叉学科,是实现人机间的信息交流,是人工智能、计算机科学和语言学所共同关注的重要方向。
显然,谁掌握了更高级的自然语言处理技术,谁在自然语言处理的技术研发中取得了实质突破,谁就将在日益激烈的人工智能军备竞赛中占得先机。一直以来,让计算机对自然语言的理解和处理能力接近人类,也是科学家们的终极愿景。
近日,来自IBM的AI研究团队就报告了Project Debater(“辩手项目”)的最新进展,研究团队表示,该系统已可以与人类专家选手进行体面且有意义的现场辩论,它能通过储存了4亿篇新闻报道和维基百科页面的知识库,自行组织开场白和反驳论点。
从演示成果来看,研究人员定义了一种辩论形式,它是学术竞争性辩论中常用的辩论风格简化版,即一旦被称为 “辩论动议” 的主题宣布,Project Debater 和人类选手都各有 15 分钟的准备时间。准备就绪后,双方就开始轮流发言。
研究人员选择了 78 个动议来评估当一个新的辩题出现时,各种 AI 系统以及人类专家的表现,每一次演讲都由 15 位评审员进行了回顾评分,以判断此演讲是否能作为支持辩题立场的良好开场白,其中 5 分表示高度一致。评估结果显示,Project Debate明显优于其他系统,并且非常接近人类专家的得分。
在开场白之后的评估中,研究人员使用了相同的 78 个动议,再次要求被选中的一组人群想象自己是辩论听众,在这种情况下,让他们阅读三篇辩论演讲,但不告知演讲的来历。
结果显示,所有辩题 Project Debater 的平均得分均高于中立 3 分,78 个动议中有 50 次表现的平均得分≥4 分,这表明,在至少 64% 的动议中,群众评论员认为 Project Debater 在辩论中表现 “良好”。不过,虽然 Project Debater 得分显著高于所有对比基线和对照组的得分,但距离人类专家的得分还有明显差距。
当然,作为一门包含着计算机科学、人工智能以及语言学的交叉学科,自然语言处理的发展也经历了曲折中发展的过程。但现在,在图像识别和语音识别领域的成果激励下,人工智能理解人类语言已经展现出了过去不曾想像的可能。