AI百科
梯度裁剪 (gradient clipping)
回复:0  浏览:335

在应用梯度值之前先设置其上限。梯度裁剪有助于确保数值稳定性以及防止梯度爆炸。