深度学习-神经网络整体架构

神经网络像多层信息加工厂，通过“前向加工+反向纠错”不断学习，最终学会从输入数据中提取规律。

Edward Nygma

519人浏览 · 2025-04-08 14:51:15

Edward Nygma · 2025-04-08 14:51:15 发布

神经网络整体架构

一句话总结：神经网络像多层信息加工厂，通过“前向加工+反向纠错”不断学习，最终学会从输入数据中提取规律。

1. 核心组成结构

（1）输入层

作用：接收原始数据（如图片像素、文字编码、传感器数值）。
相当于：工厂的原材料入口（如生肉、蔬菜）。

（2）隐藏层

作用：逐层提取和组合特征（越多层，特征越抽象）。
- 第一层：识别简单特征（如颜色、边缘）。
- 中间层：组合成复杂特征（如形状、纹理）。
- 深层：理解抽象概念（如“猫脸”“汽车轮廓”）。
相当于：加工车间（切菜→炒菜→调味）。

（3）输出层

作用：生成最终结果（分类标签、预测数值等）。
相当于：成品出口（如包装好的菜品、分拣好的快递）。

2. 工作流程

阶段1：前向传播（预测）

数据从输入层→隐藏层→输出层单向流动。
每层计算：输出 = 激活函数(权重×输入 + 偏置)。
输出层给出预测结果（如“猫的概率90%”）。

阶段2：反向传播（学习）

计算预测结果与真实值的误差（损失函数）。
从后往前逐层计算每个参数（权重、偏置）对误差的影响（梯度）。
沿梯度反方向调整参数，降低误差（如“权重A调高0.1，偏置B调低0.05”）。

3. 关键组件解释

（1）激活函数

作用：决定神经元是否传递信号（类似“质检员开关”）。
常见类型：
- ReLU：负数归零，正数保留（如“只允许合格零件通过”）。
- Sigmoid：将值压缩到0-1（如“打分转概率”）。

（2）损失函数

作用：量化预测错误程度（如“考试扣分规则”）。
常见类型：
- 均方误差（MSE）：用于预测数值（如房价）。
- 交叉熵损失：用于分类（如猫狗识别）。

（3）优化器

作用：根据梯度调整参数的具体策略（如“学习率控制步长”）。
常见类型：随机梯度下降（SGD）、Adam。

通俗比喻

快递分拣工厂：
- 输入层：扫描包裹信息 → 隐藏层：多级分拣车间 → 输出层：确定包裹目的地。
- 反向传播：发现分拣错误 → 从最后一个车间往前检查 → 调整分拣规则。
学徒学做菜：
- 前向传播：学徒按自己的理解做菜 → 反向传播：厨师尝菜后指出“盐放多了，火候不足” → 学徒调整做法。

训练与预测的区别

训练阶段：
- 包含前向传播 + 反向传播 → 不断调整参数（学菜谱）。
预测阶段：
- 仅前向传播 → 用训练好的参数输出结果（按菜谱做菜）。

总结

架构本质：多层特征加工流水线 + 自我纠错机制。
学习逻辑：试错 → 计算误差 → 反向调整 → 逐步逼近正确答案。
人类类比：像婴儿学习识别物体，从看轮廓（低级特征）到理解细节（高级特征）。

九章云极普惠算力

更多推荐

cover

阿里云 Coding Plan Lite 下架，各家算力吃紧，上哪买还能支持GLM-5和5.1的coding plan？_2026-04-15

九章云极普惠算力

cover

看遍了市面上的coding plan，我发现还是这个好用

九章云极普惠算力

Kandinsky-5.0-I2V-Lite-5s惊艳效果展示：赛博朋克街景→霓虹闪烁+雨滴滑落动态视频

本文介绍了如何在星图GPU平台上自动化部署Kandinsky-5.0-I2V-Lite-5s镜像，实现高效图生视频转换。该工具能将静态赛博朋克街景图片快速转换为动态视频，添加霓虹闪烁、雨滴滑落等效果，适用于短视频制作、广告创意等场景，显著提升内容创作效率。

九章云极普惠算力

所有评论(0)

查看更多评论

Edward Nygma

已为社区贡献3条内容