本站小编为你精心准备了稀疏表示的手写数字识别参考范文,愿这些范文能点燃您思维的火花,激发您的写作灵感。欢迎深入阅读并收藏。
《信息技术杂志》2015年第二期
1.1预处理在识别分类之前,为了达到好的识别效果,进行一些的预处理是必要的。这些预处理步骤包括配准,阈值化,字符分割等。配准是将所有的图片都放到同一个坐标框架下来比较。配准方法又分为刚性配准和弹性配准。刚性配准主要是指对图像进行旋转和平移操作,而刚性配准的主要操作包括伸缩和裁减等放射变化。本文实验选择的数字图片库是已配准过的。阈值化主要是将灰度图像转换为黑白二值图像。本文中数字分割为手动分割。
1.2数字字符表示假设训练库中共有N个样本,k类手写数字字符,每类数字有Ni(i∈[1,k])个训练样本,则有N=N1+N2+…+Ni。每个数字字符图像分辨率大小为w×h,将其按列排列成一个M维列向量V,其中M=w×h。
1.3L2、L1、L0和L1/2正则化比较在线性代数中,式(3)是一个欠定方程(M<N),其解并不唯一。常用解法为最小二乘法,即选择最小化的L2范数正则化来求解。由于L0范数与L1范数的等价条件(满足RIP等距性)的苛刻性,本文提出用L1/2来代替L1范数,但是L1/2是非凸的,它的解不是全局最优,而是局部最优,但在稀疏表示的实际应用中,局部最优就已经满足不错的近似解。式(10)中Aδi(x1)为测试图像y的重构图像,根据和原图像的残差来进行分类。
2实验结果及分析
本文改进的稀疏表示数字字符识别步骤如下:①输入:K类目标的图像字典A,测试图像y。②归一化y和A的列使其长度单位化。③求解凸最优化问题,式(9)。④计算第i类的残差ri(y)。⑤输出识别结果ID(y)=argminri(y)。
2.1改进的L1/2正则化实验采用标准的数字数据库MNIST,它包括了60000个训练样本和10000个测试样本点,每个样本点的输入含有28×28个像素,在训练样本集为每个类选取120作为样本,0~9类总共1200个样本,并训练成过完备字典,从测试集中选取500幅测试样本。以上识别步骤,1~3步骤是求解稀疏系数解,4~5步骤根据求得的系数解进行分类。在步骤3分别采用以下2种方法(基于L1范数式(8)正则化和基于L1/2式(9)正则化),并从识别时间和识别率进行对比。所选用的机器配置为,CPUIntelPentiumDualCore1.86GHz,1G内存。如表1所示,基于L1/2正则化所耗时间只比L1范数多一点,但在实验中,500个测试样本只错1个,识别率最高。L1/2正则化能够比L1正则化更好的恢复原始信号。在实验中,比如识别“0”字符时,由于“8”最近“0”字符,往往在“8”字符类中某几个样本对应的具有较大系数,这些其他类的大系数会给识别产生干扰。L1范数方法是无法避免这种误差的,而L1/2满足局部最优,能够弱化这种干扰,识别效果最好。所以在下面的实验都是基于L1/2分类。
2.2带噪声手写数字字符识别从表1可以看出本方法对无噪声的数字块能够准确识别,识别率接近100%。对带噪声、不同程度光照下的数字进行识别。采用和2.1节实验一样的字典,进行手写数字识别。图1中,a,b,c三行分别为三组实验,e列为待识别数字,分别受到噪声和光照干扰,f列为二值化结果,g列为稀疏系数图,h列为残差图,残差最小的为识别结果。通过本实验看出,即使数字图像受到强烈的噪声,也能很好的得到正确的识别结果。体现本方法具有较好的噪声鲁棒性。
2.3识别算法对比分析在相同实验条件下,比较不同算法对手数字识别效果。本文利用数字数据库MNIST,在训练集里为每个类选取120个样本,从测试集中每类选取500幅测试样本。手写数字通常是随意的,每个数字都有区别,并且带有少量噪声。如表2所示,稀疏表示算法的识别性能较其他方法超出很多,识别效果最好。而且SVM、HMM、RNN这些分类方法需要基于有效的特征提取方法,才能获得较好的识别结果。
3结束语
本文将手写数字字符图像训练为过完备字典来进行手写数字识别,并通过稀疏系数来进行分类。本文基于L1/2的正则化相比L1范数更能够恢复原始信号,从而获得更好的识别率。相比于SVM、HMM、RNN这些分类方法,稀疏算法具有更好的噪声鲁棒性,并可以避免目标识别问题中特征提取和分类器对结果的影响。然而本文对手写数字字符识别研究,训练样本比较多,如何降低训练样本,并且能获得好的字典,从而能得到较好的识别率,是接下来的主要工作。
作者:王崇阳傅迎华陈玮单位:上海理工大学光电信息与计算机学院上海交通大学自动化系