本次设计研究的主要内容包括:
1、手写数字识别方法综述。介绍常用的几种方法,并进行简要比较。
2、支持向量机、神经网络的简介。介绍对比两种方法的发展、技术原理和特点,分析支持向量机如何进行学习和实现,BP神经网络的构建和参数确定,为应用在手写数字识别进行可行性讨论。
3、手写数字识别的设计与实现。借助MATLAB平台编程作仿真实验,首先对手写数字图像进行标准化预处理,建立算法进行参数寻优,最后对测试集进行识别和结果分析。
4、Mnist数据库的扩展识别。筛选部分图像,借助SVM法对其作识别和比较分析。
1.4 本章小结
本章扼要概述该课题的研究背景、近况及主要内容,并从多个角度叙述对其研究的重要意义。
第2章 手写数字识别综述
2
手写数字识别过程大致分成预处理、特征提取、分类器分类等几个过程,预处理为能获得正确的有关数字的特性作了基础,而得到有关的数字特征则保证了最后分类的有效性[3]。
2.1 预处理技术
预处理技术,包括了尺寸和位置归一化等多个方面,通常借助它来消除数字图像中包含的噪音、压缩并剔除多余的且与判别无关的数据信息,为进一步提取特征做出不可或缺的铺垫,提升整个系统性能、判别准确率和速率[4]。预处理包括了以下几个方面,如图2-1。
二值化处理去噪锐化分割细化归一化 图2-1 预处理过程
2.1.1 图像二值化
二值化是把灰度图像转变成黑白两个等级,根据其像素的种类再进一步选择具体操作措施。通过二值化将图像中的数字目标从图像中提取出来。将原有图像中那些能够体现其轮廓特征作射影处理后,再保存下来,把那些体现不了的部分全部都作剔除处理。经过这一步操作处理之后,就能获得该图像中有关构成数字的轮廓和特征的有用信息。
2.1.2 图像去噪锐化
反色操作后噪声来源一般有:数字图像本身就存在的污损、孤立点;图片本身存在的底色在作二值化处理后造成了新噪声出现。图片本身导致的噪声干扰能借助自适应二值化算法去优化;图像中存在的笔划的凹凸、孤立墨点的情况,可以通过选择适当的结构元素去消除,或利用小波变换的时频局部化及小波基剔除图像局部高频化的噪声。数字图像的模糊边沿可以采用锐化来实现快速聚焦,改善清晰度。
2.1.3 图像分割细化
图像分割是指依照图像中的各部分像素划分成互不相同的子区域,更方便更有效地对数字后续作进一步单独处理和对数字包含信息的提取,常见的分割方法有阈值分割、区域分割和边缘检测分割等。细化是为了去除输入噪音,保留初始图像特有的几何特性,在保留最初笔划的连续性和特征的前提下,从字符边界逐层移除轮廓黑点像素。手写数字由于存在着书写位置高低、角度位置偏差等人为不可抗拒因素,都会明显增大训练的包袱还会影响识别辨认效果,分割细化后仍需对数字再作出位置矫正逼近处理。
2.1.4 归一化
由于原有图片中的数字大小都各有不同,故而需要作归一化操作,以便让其得到统一。归一化是对每个不同大小尺寸的数字子图像进行缩放射影到统一大小的字符样本中,使其能够具有大概相同的尺寸,便于后续作特征提取和分类识别。
2.2 特征提取技术
3
该部分是整个操作的重中之重,其特性信息量的获得直接关系到最终的效果。提取的方法有:结构特征和统计特征。
结构特征识别方法是从字符的结构或者造型中获取到最能够代表其形状的某类基本信息,类似如横竖撇捺、左右弯钩、交叉等。这种方法能够很好地识别字符笔画的细小改变,但文法相对复杂、对背景复杂的图像识别率较低。
统计特征识别方法是对字符信息进行全体统计学分析比较,采用像素密度特征、数形变换、模板适配等技术,识别相对稳定,抗噪声强,但不能检测到字符的笔画变化情况、字符复杂的几何和拓扑结构,识别出错的概率依然不小。
综合以上两种方法的优劣所在,现阶段手写数字特征提取技术已逐渐趋于对结构与统计特征方法的相结合。本设计采取了统计的方法,即把数字图片作反色处理后,再对像素进行统计分析获取其特性。特征提取技术如图2-1所示。 优点:能够识别笔画细 小变化。
结构识别
缺点:易出现毛刺、断 划,识别率低。
特征提取技术
优点:抗噪声强,识别 稳定。
统计识别
缺点:不能检测笔画变 化,出错概率大。
图2-2 特征提取技术
2.3 手写数字识别方法
2.3.1 决策树法
一种类似流程图的从上到下的树形结构。其基本思想如图2-3所示。
训练数据集训练集分类算法决策树
图2-3 决策树基本思想
4
用一个逻辑判断说明其内部节点(非叶节点),如:形式为a?b。其中:
根节点属性值属性值非叶子节点1No属性值YesNoNo非叶子节点2属性值Yes
图2-4 决策树结构图
决策树优点有:
①准确性高、速度快,易于解释和理解;
②基本上无需对要作判别的数据作处理,即使需要,该准备工作也是很容易处理,而其它方法必须先作剔除冗余的操作。
然而,其缺点也是很明显,主要表现在:
①当存在信息类别多且数目不统一情况时,出错的速度在某种程度上会出现很大幅度的增加。
②内部节点的判别具有明确性,这种明确性可能会带来误导。
2.3.2贝叶斯判别法
贝叶斯(Bayes)判别方法是按照Bayes统计思想的应用,根据最小风险代价判决或最大似然比进行判决。Bayes决策法主要有以下两类。 (1)基于最小错误率的Bayes决策
依照样本库中样本的密度函数,借助Bayes算出待识变量在各状态的概率。在哪个状态下最大就把它划为哪一类。
已知有n?个p?维总体G1、G2、?、Gn(每个总体Gi能看作是其指数X?X1、X2、?、
,借助经验或估计可得:Gi的先验概率分别为q1、q2、?、qn。 显然有: Xn?的所有取数)
qi?0(i=1,2,?,n)且?qi=1(2-1)
i=1n各总体Gi对应的p维密度函数f1(x)、f2(x)、?、fn?x?,在得到一个样本x的情形
5
后,借助Bayes公式计算该样本x来自第k个总体的后验概率:
q?f(x)kP()?nkk?????????(k?1,2,?n)(2-2) x?qi?fi(x)i?1hk当存在:P()???max?P() 时,则:判x来自第h个总体。
1?k?nxx(2)基于最小风险的Bayes决策
依照样本库中样本的密度函数及损失函数,借助Bayes得到概率,再根据后验概率和损失函数计算出各种辨认结果的损失,其中错判损失最小的即为最后的识别结果。
把x错判成第h个总体的平均损失定义为:
q?f(x)?h?hE()????nkk??L??(2-3) xk?h?k?q?f(x)?iii?1
L(h/k):损失函数,表示将样品错判的损失。当h?k时,有:L(h/k)=0;当h?k时,
有:L(h/k)>0 。
当存在:E(h/x)?minE(k/x),则:判x来自第h个总体。
1?k?g实际上,错判造成的损失认为是等同的,即:
?0,???h?k(2-4) L(k/x)???1,???h?k
识别流程图如下图2-5。
6
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库基于SVM和BP神经网络的手写数字识别(2)在线全文阅读。
相关推荐: