AI百科
AdaGrad
回复:0  浏览:319

一种先进的梯度下降法,用于重新调整每个参数的梯度,以便有效地为每个参数指定独立的学习速率