AI百科
随机梯度下降法 (SGD, stochastic gradient descent)
回复:0  浏览:394

批次规模为 1 的一种梯度下降法。换句话说,SGD 依赖于从数据集中随机均匀选择的单个样本来计算每步的梯度估算值。