Select Language

AI社区

数据要素产业

精确的符号人工智能,可更快、更好地评估 AI 公平性

司法系统、银行和私营公司使用算法来做出对人们生活产生深远影响的决策。不幸的是,这些算法有时是有偏见的当有色人种和低收入阶层的人申请贷款或工作时,甚至当法院决定在一个人等待审判时应该设置什么保释金时,他们都会产生不成比例的影响。

麻省理工学院的研究人员开发了一种新的人工智能编程语言,与可用的替代方案相比,它可以更准确、更快速地评估算法的公平性。

他们的 Sum-Product Probabilistic Language (SPPL) 是一种概率编程系统。概率编程是编程语言和人工智能交叉领域的一个新兴领域,旨在使人工智能系统更容易开发,并在计算机视觉、常识数据清理和自动数据建模方面取得了早期成功。概率编程语言使程序员更容易定义概率模型并进行概率推理也就是说,反向工作以推断观察数据的可能解释。

“以前的系统可以解决各种公平问题。我们的系统不是第一个;但由于我们的系统专门针对某一类模型进行了优化,因此它可以以数千倍的速度提供解决方案,”博士 Feras Saad 说。 .D. 电气工程和计算机科学 (EECS) 的学生,也是最近一篇描述该工作的论文的第一作者。Saad 补充说,加速并不是无关紧要的:该系统的速度可以比以前的方法快 3,000 倍。

SPPL 为概率推理问题提供了快速、准确的解决方案,例如“模型向 40 岁以上的人推荐贷款的可能性有多大?” 或“生成 1,000 名综合贷款申请人,年龄均在 30 岁以下,他们的贷款将获得批准。” 这些推理结果基于 SPPL 程序,该程序对可能的申请人类型、先验以及如何对他们进行分类的概率模型进行编码。SPPL 可以回答的公平问题包括“向具有相同社会经济地位的移民和非移民申请人推荐贷款的概率是否存在差异?” 或者“考虑到候选人有资格胜任这份工作并且来自一个代表性不足的群体,聘用的可能性是多少?”

SPPL 不同于大多数概率编程语言,因为 SPPL 只允许用户编写能够自动提供准确概率推理结果的概率程序。SPPL 还使用户可以检查推理的速度,从而避免编写缓慢的程序。相比之下,其他概率编程语言(如 Gen 和 Pyro)允许用户编写概率程序,其中唯一已知的推理方法是近似的也就是说,结果包括其性质和幅度难以表征的错误。

在许多 AI 应用程序中,近似概率推理的错误是可以容忍的。但是,在人工智能的具有社会影响力的应用(例如自动决策,尤其是公平分析)中,推理错误会破坏结果是不可取的。

波士顿学院副教授、甲骨文实验室前研究科学家让-巴蒂斯特特里斯坦(Jean-Baptiste Tristan)没有参与这项新研究,他说:“我曾在学术界和现实世界的大规模行业环境中进行公平分析. 由于语言的表达能力、精确而简单的语义以及精确符号推理引擎的速度和健全性,SPPL 在这类具有挑战性和重要的问题上提供了比其他 PPL 更高的灵活性和可信度。”

SPPL 通过将模型限制在精心设计的一类模型中来避免错误,该类模型仍包含广泛的 AI 算法类别,包括广泛用于算法决策的决策树分类器。SPPL 的工作原理是将概率程序编译成称为“和积表达式”的专用数据结构。SPPL 进一步建立在使用概率电路作为实现高效概率推理的表示这一新兴主题之上。这种方法将和积网络的先前工作扩展到通过概率编程语言表达的模型和查询。然而,Saad 指出,这种方法有局限性:“例如,SPPL 在分析决策树的公平性方面要快得多,但它不能分析像神经网络这样的模型。

“SPPL 表明,对于广泛的概率程序,精确概率推理是实用的,而不仅仅是理论上可行,”麻省理工学院首席研究科学家和论文的资深作者 Vikash Mansinghka 说。“在我的实验室中,我们已经看到符号推理在我们之前通过近似蒙特卡罗和深度学习算法处理的其他推理任务中提高了速度和准确性。我们还一直将 SPPL 应用于从现实世界数据库中学习的概率程序,量化罕见事件的概率,在给定约束的情况下生成合成代理数据,并自动筛选数据以查找可能的异常情况。”

新的 SPPL 概率编程语言于 6 月在 ACM SIGPLAN 编程语言设计与实现国际会议 (PLDI) 上发表,该论文由 Saad 与麻省理工学院 EECS 教授 Martin Rinard 和 Mansinghka 共同撰写。SPPL 是用 Python 实现的,并且是开源的。

 
更多>数据要素产业相关信息
最新发布
点击排行