损失函数:

L1损失:

n个样本的平均绝对误差(MAE):

MAE=\frac{1}{n}\sum_{i=1}^n {|y_i-\hat{y_i}|}

即,真实值y_i和预测值\hat{y_i}之间的差值的绝对值的和。

使用L1损失函数,就是最小化MAE。

L2损失:

n个样本的均方误差(MSE):

MSE=\frac{1}{n}\sum_{i=1}^n {​{(y_i-\hat{y_i})}^2}

即,真实值y_i和预测值\hat{y_i}之间的差值的平方的和。

 使用L2损失函数,就是最小化MSE。

 

正则化:

L1正则化:即对权重矩阵的每个元素绝对值求和:

\lambda*||W||

L2正则化:即对权重矩阵的每个元素求平方和(先平方,后求和):

\frac{1}{2}*\lambda*{||W||}^2

注意:正则化项不需要求平均数,因为权重矩阵和样本数量无关,只是为了限制权重规模。

更多推荐