基于梯度的可解释性的广义反向传播

Kevin Du, Lucas Torroba Hennigen, Niklas Stoehr, Alex Warstadt 以及 Ryan Cotterell
用于解释深度神经网络的许多流行的特征归因方法依赖于计算模型的输出相对于其输入的梯度。虽然这些方法可以指示哪些输入特征对模型的预测可能很重要,但它们很少揭示模型本身的内部工作原理。在本文中,我们观察到模型的梯度计算是使用半环的更一般公式的特例。这一观察结果使我们...

用户分享观点: