深度学习：逻辑回归的损失函数

逻辑回归的损失函数主要是，也称为。它是分类任务中常用的损失函数，特别适用于二分类问题。

渣渣伟

2100人浏览 · 2024-11-28 13:14:02

渣渣伟 · 2024-11-28 13:14:02 发布

逻辑回归的损失函数主要是对数损失函数（Log Loss），也称为交叉熵损失（Cross-Entropy Loss）。它是分类任务中常用的损失函数，特别适用于二分类问题。

1. 二分类逻辑回归损失函数

假设与输出

输入特征： $\mathbf{x} \in \mathbb{R}^n$
模型输出（预测概率）：
$y^=σ(wTx+b)=11+e−(wTx+b) \hat{y} = \sigma(\mathbf{w}^T \mathbf{x} + b) = \frac{1}{1 + e^{-(\mathbf{w}^T \mathbf{x} + b)}}$
其中 $σ(⋅)\sigma(\cdot)$ 是 Sigmoid 函数，将线性输出映射为 0 到 1 之间的概率。
真实标签： $\in \{0, 1\}$

$\Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,.$

损失函数公式

$L(y,y^)=−1N∑i=1N[yilog⁡(y^i)+(1−yi)log⁡(1−y^i)] L(y, \hat{y}) = - \frac{1}{N} \sum_{i=1}^N \left[ y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right]$

其中：

$N$ 是样本数。
$y^i\hat{y}_i$ 是第 $i$ 个样本的预测概率。
$y_i$ 是第 $i$ 个样本的真实标签。

推导过程

目标： 最大化似然函数（MLE，Maximum Likelihood Estimation）。
$P(y∣x)=y^y(1−y^)1−y P(y | \mathbf{x}) = \hat{y}^y (1 - \hat{y})^{1 - y}$
对所有样本的联合概率：
$L(w,b)=∏i=1Ny^iyi(1−y^i)1−yi L(\mathbf{w}, b) = \prod_{i=1}^N \hat{y}_i^{y_i} (1 - \hat{y}_i)^{1 - y_i}$
最大化似然函数等价于最小化负对数似然：
$ℓ(w,b)=−log⁡L(w,b)=−∑i=1N[yilog⁡(y^i)+(1−yi)log⁡(1−y^i)] \ell(\mathbf{w}, b) = -\log L(\mathbf{w}, b) = -\sum_{i=1}^N \left[ y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right]$
对单个样本的损失函数：
$ℓ(y,y^)=−[ylog⁡(y^)+(1−y)log⁡(1−y^)] \ell(y, \hat{y}) = - \left[ y \log(\hat{y}) + (1 - y) \log(1 - \hat{y}) \right]$

解释

当 ( y = 1 ) 时，损失函数为：
$−log⁡(y^) -\log(\hat{y})$
即预测概率越接近 1，损失越小。
当 ( y = 0 ) 时，损失函数为：
$−log⁡(1−y^) -\log(1 - \hat{y})$
即预测概率越接近 0，损失越小。

2. 多分类逻辑回归（Softmax 回归）损失函数

对于多分类问题，输出类别的概率使用 Softmax 函数，交叉熵损失函数为：

Softmax 函数

$y^k=ezk∑j=1Kezj \hat{y}_k = \frac{e^{z_k}}{\sum_{j=1}^K e^{z_j}}$
其中 $K$ 是类别数， $zk=wkTx+bkz_k = \mathbf{w}_k^T \mathbf{x} + b_k$ 是第 $k$ 类的线性输出。

损失函数

$L(y,y^)=−1N∑i=1N∑k=1Kyi,klog⁡(y^i,k) L(y, \hat{y}) = - \frac{1}{N} \sum_{i=1}^N \sum_{k=1}^K y_{i,k} \log(\hat{y}_{i,k})$
其中 $y_{i,k}$ 是 one-hot 编码的真实标签。

3. 损失函数的性质

非负性： 损失函数总是非负的。
凸性： 对于逻辑回归，损失函数是凸函数，可以通过梯度下降等优化方法找到全局最优解。
概率解释： 损失函数本质上是最大化样本标签的预测概率。

示例代码

import numpy as np

def logistic_loss(y_true, y_pred):
    """
    计算二分类逻辑回归的交叉熵损失
    """
    epsilon = 1e-15  # 防止对数运算出现数值错误
    y_pred = np.clip(y_pred, epsilon, 1 - epsilon)  # 限制预测值在合理范围内
    loss = -np.mean(y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred))
    return loss

# 示例
y_true = np.array([1, 0, 1, 0])  # 真实标签
y_pred = np.array([0.9, 0.1, 0.8, 0.2])  # 预测概率

loss = logistic_loss(y_true, y_pred)
print(f"逻辑回归损失：{loss:.4f}")

你希望进一步了解损失函数的优化过程、梯度推导，还是如何在实际项目中使用它？

九章云极普惠算力

更多推荐

@github/relative-time-element 与标准＜time＞元素的对比分析

在现代Web开发中，时间展示是用户体验的重要组成部分。标准HTML5的`<time>`元素虽然能够标记时间，但在动态显示和本地化方面存在局限。而`@github/relative-time-element`作为一款强大的Web组件扩展，为开发者提供了更灵活、智能的时间处理方案。本文将深入对比这两种时间元素的功能特性，帮助你快速掌握它们的差异与应用场景。## 核心功能对比：静态标记 vs 动态智

九章云极普惠算力

March7thAssistant企业合作：探索与游戏开发商的创新合作模式

March7thAssistant作为一款专注于崩坏：星穹铁道的全自动辅助工具，正通过其强大的自动化任务处理能力，为游戏生态带来新的可能性。本文将深入探讨该工具与游戏开发商之间的潜在合作空间，以及如何通过技术创新实现双赢。## 工具核心价值：重新定义玩家体验March7thAssistant的核心优势在于其全面的自动化任务系统，能够帮助玩家高效完成日常任务、资源收集和活动参与。从自动战斗到

九章云极普惠算力

为什么选择Topcoat？探索轻量级CSS框架的独特优势 ✨

Topcoat是一个专注于构建**干净且快速Web应用**的轻量级CSS框架。它通过精心设计的样式规则和组件系统，帮助开发者轻松创建具有专业外观的用户界面，同时保持代码的简洁性和高性能。无论是桌面端还是移动端应用，Topcoat都能提供一致且优雅的设计体验。## 🚀 Topcoat的核心优势### 1. 极致轻量化设计Topcoat的核心理念是"轻装上阵"。相比其他动辄数百KB的CSS