返回
AI百科
梯度裁剪 (gradient clipping)
回复:0 浏览:
335
楼主
小小程序员
圈主
2021-05-15 22:39
在应用梯度值之前先设置其上限。梯度裁剪有助于确保数值稳定性以及防止梯度爆炸。