问题定义

本例子展示如何通过神经网络进行简单的字符识别。

根据帮助文档,待分析的数据通过脚本prprob生成,此脚本定义了一个矩阵,共26列,每一列是字母表中的一个字母。每一列有25行,数值为0或1。通过这样的数据表示,每一个字母是一个5×7的位图。

导入数据

[X,T] = prprob;

逐个进行显示,如下图所示。

字符A

 其他25个字符如下图所示

for ii=1:25
    subplot(5,5,ii);
    plotchar(X(:,ii+1));
end

 

训练过程

随机数种子初始化

setdemorandstream(pi);

生成第一个神经网络【无噪声】

net1 = feedforwardnet(25);
view(net1)

得到如下神经网络示意图

 训练第一个神经网络【无噪声】

net1.divideFcn = '';
net1 = train(net1,X,T,nnMATLAB);

得到如下结果

 从Regression图中,可以看出几乎完美拟合。

 训练第二个神经网络【增加噪声】

针对每一个字母的位图,生成了30个带有噪声的图片。

numNoise = 30;
Xn = min(max(repmat(X,1,numNoise)+randn(35,26*numNoise)*0.2,0),1);
Tn = repmat(T,1,numNoise);

带噪音版本的字母A如下图所示

其他字母如下图所示

for ii=1:25
    subplot(5,5,ii);
    plotchar(Xn(:,ii+1));
end

 生成新的网络并进行训练

net2 = feedforwardnet(25);
net2 = train(net2,Xn,Tn,nnMATLAB);

得到如下结果

 Performance:

在验证集上虽然出现了最低点,但是迭代后期函数值变化较小。

 从Regression可以看出,拟合效果出现了散布。

 对比分析

逐步增加测试集Test Set的噪声水平,再次对无噪声训练的网络【记为网络1】和添加噪声后训练的网络【记为网络2】进行测试,发现:

(1)在噪声水平较低(小于0.1)两个网络的误差率相等且均较低;【从另一角度其实可以反映出,网络1其实是一个过拟合的网络。】

(2)在噪声水平∈(0.2,0.4)范围内,网络1误差率迅速上升,而网络2误差率有所上升,仍大幅小于误差1;

(3)在噪声水平∈(0.4,1)范围内,网络1误差率一直维持在较高的程度,而网络2误差率持续上升,仍大幅小于误差1。

可见,在网络经过含噪声的数据训练后,对噪声的容忍度更强。

noiseLevels = 0:.05:1;
numLevels = length(noiseLevels);
percError1 = zeros(1,numLevels);
percError2 = zeros(1,numLevels);
for i = 1:numLevels
  Xtest = min(max(repmat(X,1,numNoise)+randn(35,26*numNoise)*noiseLevels(i),0),1);
  Y1 = net1(Xtest);
  percError1(i) = sum(sum(abs(Tn-compet(Y1))))/(26*numNoise*2);
  Y2 = net2(Xtest);
  percError2(i) = sum(sum(abs(Tn-compet(Y2))))/(26*numNoise*2);
end

figure
plot(noiseLevels,percError1*100,'--',noiseLevels,percError2*100);
title('Percentage of Recognition Errors');
xlabel('Noise Level');
ylabel('Errors');
legend('Network 1','Network 2','Location','NorthWest')

 

更多推荐