深度学习 5层CNN代码实现图片分类 训练集共有9个文件夹代表9类,每类有50张图片,可根据需要自行准备训练集 MATLAB代码,代码注释清楚,容易上手 温馨提示:联系请考虑是否需要,(Example_7)

在深度学习领域,卷积神经网络(CNN)是图片分类任务中极为常用且强大的模型。今天咱就用MATLAB来实现一个5层CNN做图片分类,数据集有9个类别,每个类别50张图片。

准备训练集

首先,我们得准备好数据。假设这9个文件夹都在一个名为data的主文件夹下。

dataDir = 'data';
imageDir = imageDatastore(dataDir, 'IncludeSubfolders', true, 'LabelSource', 'foldernames');

这段代码使用imageDatastore函数创建了一个图像数据存储对象imageDirIncludeSubfolders设置为true意味着它会递归搜索子文件夹,LabelSource设置为foldernames则表示文件夹名就是图片的类别标签。

构建5层CNN网络

下面开始搭建5层的CNN网络结构。

layers = [
    imageInputLayer([224 224 3])
    
    convolution2dLayer(3,16,'Padding','same')
    batchNormalizationLayer
    reluLayer
    
    maxPooling2dLayer(2,'Stride',2)
    
    convolution2dLayer(3,32,'Padding','same')
    batchNormalizationLayer
    reluLayer
    
    maxPooling2dLayer(2,'Stride',2)
    
    convolution2dLayer(3,64,'Padding','same')
    batchNormalizationLayer
    reluLayer
    
    maxPooling2dLayer(2,'Stride',2)
    
    convolution2dLayer(3,128,'Padding','same')
    batchNormalizationLayer
    reluLayer
    
    maxPooling2dLayer(2,'Stride',2)
    
    fullyConnectedLayer(9)
    softmaxLayer
    classificationLayer];

imageInputLayer([224 224 3])指定了输入图像的大小为224x224像素,且是RGB三通道图像。

convolution2dLayer(3,16,'Padding','same')表示一个卷积层,卷积核大小为3x3,输出16个特征图,Padding设置为same保证卷积后的特征图大小与输入相同。

batchNormalizationLayer用于批量归一化,加速网络收敛。reluLayer是激活函数层,采用ReLU函数引入非线性。

maxPooling2dLayer(2,'Stride',2)进行最大池化操作,池化核大小为2x2,步长为2,起到降采样的作用。

fullyConnectedLayer(9)是全连接层,因为我们有9个类别,所以输出维度为9。softmaxLayer将全连接层的输出转换为概率分布,classificationLayer定义了分类任务的损失函数。

训练模型

接下来训练我们构建好的网络。

options = trainingOptions('adam',...
    'InitialLearnRate',0.001,...
    'MaxEpochs',50,...
    'MiniBatchSize',32,...
    'Shuffle','every-epoch',...
    'ValidationData',imageDir,...
    'ValidationFrequency',3,...
    'Verbose',false,...
    'Plots','training-progress');

net = trainNetwork(imageDir,layers,options);

trainingOptions设置了训练的各项参数。这里使用adam优化器,初始学习率为0.001,最大训练轮数为50,每批训练样本数为32。Shuffle设置为every-epoch,表示每轮训练前打乱数据顺序。ValidationData指定验证集,ValidationFrequency表示每3轮进行一次验证。Verbose设为false关闭详细输出,Plots设为training - progress会绘制训练进度图。

最后通过trainNetwork函数使用训练集数据imageDir和定义好的网络层layers,按照设置的训练选项options来训练网络,得到训练好的模型net

通过以上步骤,我们就用MATLAB实现了一个5层CNN的图片分类模型。希望这篇博文能帮助你快速上手深度学习中的图片分类任务。如果在实践过程中有任何问题,欢迎一起探讨。

更多推荐