PaddlePaddle深度学习实战：PaddlePaddle深度学习入门-构建与训练神经网络

本课程介绍深度学习基础概念及PaddlePaddle框架应用。课程内容包括神经网络结构、损失函数和优化器原理，重点讲解如何使用PaddlePaddle构建简单神经网络模型。通过实例演示，学员将学习如何定义网络层、计算交叉熵损失、使用Adam优化器训练MNIST分类模型。课程提供完整的代码示例，包括数据加载、模型构建、训练过程等，帮助学员掌握深度学习模型的基本开发流程。学习目标是为学员打下深度学习基

WSSWWWSSW

636人浏览 · 2025-10-28 10:38:17

WSSWWWSSW · 2025-10-28 10:38:17 发布

深度学习基础：PaddlePaddle介绍

学习目标

本课程将带领学员深入了解深度学习的基本概念，包括神经网络的结构、损失函数的作用以及优化器的工作原理。通过本课程的学习，学员将能够使用PaddlePaddle框架构建简单的神经网络模型，并理解模型训练的基本流程。

学习内容

1 PaddlePaddle介绍

1.1 神经网络基础

神经网络是深度学习的核心，它模仿人脑神经元的工作方式，通过多层的节点（或称为神经元）来处理信息。每个神经元接收输入，处理这些输入，并产生输出。这些输出可以作为下一层神经元的输入，形成一个复杂的网络结构。神经网络的这种结构使得它能够学习和表示复杂的函数，从而在图像识别、自然语言处理等领域取得了显著的成就。

在PaddlePaddle中，构建神经网络非常直观。我们可以通过定义层（Layer）来构建网络。每一层可以包含多个神经元，这些神经元通过激活函数（如ReLU、Sigmoid等）来引入非线性，使得网络能够学习到数据中的复杂模式。

pip install paddlepaddle==3.0.0

# 构建一个简单的神经网络
import paddle
from paddle.nn import Linear, ReLU, Sequential

# 定义一个简单的神经网络
class SimpleNet(paddle.nn.Layer):
    def __init__(self):
        super(SimpleNet, self).__init__()
        # 定义网络层
        self.layer1 = Linear(in_features=784, out_features=256)
        self.relu = ReLU()
        self.layer2 = Linear(in_features=256, out_features=10)

    def forward(self, x):
        # 前向传播
        x = paddle.flatten(x, start_axis=1)
        x = self.layer1(x)
        x = self.relu(x)
        x = self.layer2(x)
        return x

# 创建网络实例
net = SimpleNet()
print(net)

1.2 损失函数

损失函数是评估模型预测结果与实际结果之间差异的函数。在训练神经网络时，我们通过最小化损失函数来调整模型的参数，使得模型的预测结果尽可能接近真实值。常见的损失函数包括均方误差（MSE）、交叉熵损失（Cross Entropy）等。

在PaddlePaddle中，可以使用内置的损失函数来计算模型的损失。例如，对于分类任务，我们通常使用交叉熵损失函数。

# 计算交叉熵损失
import paddle.nn.functional as F

# 假设我们有一个模型的输出和真实标签
outputs = paddle.to_tensor([[0.1, 0.2, 0.7], [0.8, 0.1, 0.1]])
labels = paddle.to_tensor([2, 0])

# 计算交叉熵损失
loss = F.cross_entropy(outputs, labels)
print(loss)

1.3 优化器

优化器是用于更新模型参数以最小化损失函数的算法。常见的优化器包括梯度下降（Gradient Descent）、随机梯度下降（SGD）、Adam等。优化器通过计算损失函数对模型参数的梯度，并根据这些梯度来调整参数，从而逐步优化模型。

在PaddlePaddle中，可以使用内置的优化器来训练模型。例如，我们可以使用Adam优化器来训练上述定义的神经网络。
备注：下列带！的是Jupyter notebook的写法，bash去掉！即可。

!wget https://model-community-picture.obs.cn-north-4.myhuaweicloud.com/ascend-zone/notebook_datasets/c3030fa02fc211f08112c0d193714e3c/mnist.zip

!unzip mnist.zip

from paddle.vision.transforms import Compose, Normalize
from paddle.io import Dataset
import paddle
import numpy as np
import os
from PIL import Image

# 定义自定义 MNIST 数据集
class LocalMNIST(Dataset):
    def __init__(self, data_path, mode='train', transform=None):
        super(LocalMNIST, self).__init__()
        self.data_path = data_path
        self.mode = mode
        self.transform = transform
        self.images = []
        self.labels = []
        
        # 加载图像和标签
        self.load_data()

    def load_data(self):
        if self.mode == 'train':
            image_file = os.path.join(self.data_path, 'train-images-idx3-ubyte')
            label_file = os.path.join(self.data_path, 'train-labels-idx1-ubyte')
        else:
            image_file = os.path.join(self.data_path, 't10k-images-idx3-ubyte')
            label_file = os.path.join(self.data_path, 't10k-labels-idx1-ubyte')

        # 读取图像文件
        with open(image_file, 'rb') as f:
            images = np.frombuffer(f.read(), np.uint8, offset=16)
            images = images.reshape(-1, 28, 28)

        # 读取标签文件
        with open(label_file, 'rb') as f:
            labels = np.frombuffer(f.read(), np.uint8, offset=8)

        self.images = images
        self.labels = labels

    def __getitem__(self, idx):
        image = Image.fromarray(self.images[idx].astype('uint8'), 'L')
        label = np.array(self.labels[idx], dtype='int64')

        if self.transform is not None:
            image = self.transform(image)

        return image, label

    def __len__(self):
        return len(self.labels)

# 定义数据集路径
train_dataset_path = 'mnist/train'
test_dataset_path = 'mnist/test'

# 定义数据预处理
transform = Compose([Normalize(mean=[127.5], std=[127.5], data_format='CHW')])

# 创建自定义数据集
train_dataset = LocalMNIST(train_dataset_path, mode='train', transform=transform)
test_dataset = LocalMNIST(test_dataset_path, mode='test', transform=transform)

# 测试数据集
print(f"Train dataset size: {len(train_dataset)}")
print(f"Test dataset size: {len(test_dataset)}")

# 获取一个样本
image, label = train_dataset[0]
print(f"Image shape: {image.shape}, Label: {label}")

# 使用Adam优化器训练模型
import paddle
from paddle.optimizer import Adam

# 创建数据加载器
train_loader = paddle.io.DataLoader(train_dataset, batch_size=64, shuffle=True)

# 创建模型和优化器
net = SimpleNet()
optimizer = Adam(learning_rate=0.001, parameters=net.parameters())

# 训练模型
for epoch in range(5):
    for batch_id, (images, labels) in enumerate(train_loader):
        images = paddle.flatten(images, 1)
        outputs = net(images)
        loss = F.cross_entropy(outputs, labels)
        
        # 反向传播和优化
        loss.backward()
        optimizer.step()
        optimizer.clear_grad()
        
        if batch_id % 100 == 0:
            print(f'Epoch {epoch}, Batch {batch_id}, Loss {loss.numpy()}')

通过本课程的学习，学员将能够理解神经网络的基本结构、损失函数的作用以及优化器的工作原理，并能够使用PaddlePaddle框架构建和训练简单的神经网络模型。希望这些知识能够为学员在深度学习领域的进一步探索打下坚实的基础。

九章云极普惠算力

更多推荐

大语言模型系列(3): Qwen2.5-VL-3B 多模态模型端侧部署

九章云极普惠算力

【科研学习记录】自适应动态规划（ADP）与强化学习（RL）理论入门

本文探讨了动态规划(DP)、自适应动态规划(ADP)和强化学习(RL)的核心思想及其相互关系。三者都旨在解决动态系统中的多步决策问题，通过贝尔曼方程将复杂问题分解为单步决策。文章首先介绍了状态、动作和回报三个核心概念，以及期望、递推关系和压缩映射等数学基础。重点分析了传统DP的局限性（模型依赖、维度灾难和离线计算），并详细阐述了ADP的改进方案：数据驱动、函数逼近和在线自适应。特别介绍了ADP的双