深度学习之激活函数——Leaky ReLU

Leaky ReLU激活函数是为了解决ReLU激活函数会出现的dead relu神经元死亡的现象，而这一现象的根本原因是ReLU函数在x0的范围内梯度恒为0，无法更新参数。所以Leaky ReLU将x0的部分换成一个斜率很小的一个线性函数来解决这一问题。

康康好老啊

3826人浏览 · 2024-05-18 13:21:49

康康好老啊 · 2024-05-18 13:21:49 发布

Leaky ReLU激活函数是为了解决ReLU激活函数会出现的dead relu神经元死亡的现象，而这一现象的根本原因是ReLU函数在 $x < 0$ 的范围内梯度恒为0，无法更新参数。所以Leaky ReLU将 $x < 0$ 的部分换成一个斜率很小的一个线性函数来解决这一问题。

函数表达式

$f(x)=max\{\alpha x,x\},其中\alpha<<1$

当 $x < 0$ 时，函数值为 $f(x)=αxf(x)=\alpha x$ ，比如像 $f (x) = 0.001 x$ ；当 $x > 0$ 时，函数值为 $f (x) = x$

函数图像

请添加图片描述

函数特性

虽然其是ReLU的优化，但是实验中其整体效果不如ReLU（或者说不相上下，但是在ReLU调参合理的情况下，Leaky ReLU优势很弱）。如果数据处理后绝大部分为正数或者归一化到(0,1)，则无需使用Leaky ReLU。

优点：

可以在一定程度上解决ReLU出现的dead ReLU问题，虽然斜率 $α\alpha$ 的值很小，但是依然存在梯度可以更新

缺点：

由于该函数很像一个线性函数，所以其对复杂分类的效果不是很好

九章云极普惠算力

更多推荐

混合精度训练革命：happy-llm如何用16位浮点数实现效率与精度双赢

在大语言模型训练领域，混合精度训练已经成为提升训练效率的关键技术。通过巧妙结合16位和32位浮点数，happy-llm项目展示了如何在保证模型精度的同时，显著降低显存占用并加速训练过程。## 什么是混合精度训练？混合精度训练是一种结合不同精度浮点数进行深度学习训练的技术。它主要使用16位浮点数（FP16或BF16）进行前向传播和反向传播，同时保留32位浮点数用于关键的权重更新操作。[!

九章云极普惠算力

Zero邮件备份恢复：数据丢失预防与恢复的完整方案

在数字化时代，邮件数据安全已成为企业和个人用户面临的重要挑战。Zero开源邮件应用提供了一套完整的邮件备份恢复方案，通过智能数据保护机制确保您的邮件信息安全无忧。无论您是担心误删重要邮件、系统故障导致数据丢失，还是需要长期归档关键通信记录，Zero的备份恢复功能都能为您提供可靠保障。## 🔒 数据丢失预防：多重保护机制Zero邮件应用内置了**乐观更新机制**，在用户执行操作时立即提供视

九章云极普惠算力

突破推理瓶颈：vLLM多模态时空决策系统重构智慧城市规划流程的完整指南

在当今智慧城市建设的浪潮中，vLLM多模态时空决策系统正以其卓越的高吞吐量和内存效率，彻底重构传统城市规划流程。作为专门为大型语言模型设计的推理和服务引擎，vLLM通过创新的架构设计，解决了传统AI系统在处理复杂时空数据时的性能瓶颈，为城市规划者提供了前所未有的决策支持能力。## 🚀 vLLM多模态时空决策系统的核心优势vLLM多模态时空决策系统采用了分层架构设计，从模型引擎到分布式计算