哈尔滨学院本科毕业论文(设计)
话音识别。他们的做法是,将取自芬兰语各种基本语音的各个样本按一定顺序轮流输入到一个自组织网络中进行学习,经过足够次数的学习后这些样本逐渐在网络节点中形成确定的映射关系,即每个样本都映射到各自固定的一个节点(在这个样本作输入时,该节点为最佳匹配节点或具有最大输出),而映射到同一节点的样本就可以看作是一个聚类。学习完成后,发现不但同一聚类中的样本来自同一音素,而且相邻节点对应的聚类中的样本往往也来自相同或相近发音的音素。在识别时,对于新的输入样本,将其识别为它映射到的节点所标的发音即可。
这种做法实际上是在非教师学习的基础上进行教师模式识别。其最大的优点就是,最终的各个相邻聚类之间是有相似关系的,即使识别时把样本映射到了一个错误的节点,它也倾向于被识别成同一个音素或者一个发音相近的音素,这就十分接近于人的识别特性。
3.2 基于BP神经网络的模式识别
单层神经网络只能解决线性可分的问题,对于非线性分类问题就需要运用多层神经网络,还需要寻找训练多层神经网络的学习算法。目前,最著名的多层神经网络学习算法应该是BP算法。BP算法训练的神经网络就是BP神经网络。在众多人工神经网络模型中,大部分采用BP网络或是它的变化形式,可以说BP 神经网络是前馈型网络的核心部分,体现了人工神经网络最精华的部分。BP神经网络采用的是有教师学习方式。
BP网络在神经网络模式识别系统中的应用最为广泛,它是基于误差反向传播算法的一种具有非线性连续转移函数的多层前馈网络。由于多层前馈网络的训练经常采用误差反同传播算法,人们常把多层前馈网络直接称为BP网络。BP算法的基本思想是最小二乘法学习算法,它采用梯度搜索技术以期望使网络的实际输出值与期望输出值之间的误差均方值达到最小,这是一种可以避免统计平均的递推算法。学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层传入,经各隐含层逐层处理后,传递至输出层。若输出层的实际输出值与期望的输出值不符,则转入误差的反向传播阶段。误差反向传播是将输出误差以某种形式通过隐含层向输入层逐层反传、并将误差分摊给各层的所有单元来获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反问传播的各层权值修正过程是周而复始地进行的。权值不断修正的过程,也就是网络的学习训练过程。此过程一直进行,直到网络输出的误差减少到可接受的程度或者达到预先设定的学习次数为止。
3.3 BP神经网络在不同领域的识别应用
BP神经网络在地图识别、数字图像识别、医学检测、工业加工、语音识别等各个方面
12
哈尔滨学院本科毕业论文(设计)
都有广泛的应用:
3.3.1 BP神经网络在指纹识别中的应用流程
⑴ 图象的采集
目前指纹识别中, 大概有两种采集方案,一种是光学摄像头,一种是CMOS电容阵列。 CMOS阵列的传感器阵列的方案,原理是每个点都相当于一个电容,测量接触点的电荷就知道有没有接触,传感器的表面是绝缘的,当手指放在上面时,皮肤组成了电容阵列的另一面。
光学摄像头的方案,依据的是光的全反射原理(FTIR)。 ⑵ 图像的预处理
在预处理中,最终的目标是对输入图像进行适当的分解,将其分为指纹图像的前景(图案)和背景。为了确保细节特征算法的性能,我们需要进行指纹图像增强。实际实现时, 指纹图像增强一般采用以下几个环节:规格化、方向图估计、频率图估计、生成模板、滤波,对指纹图像规格化的目的是将该灰度图的方差降低。
⑶ 指纹图像的增强
由于受采集设备和活体指纹采集条件等因素的限制,采集到得指纹图像往往不够清晰。为了确保指纹特征的提取正确,需要对原始指纹图像进行增强处理,增加指纹纹线的清晰度,增强脊线和谷线的对比度,减少噪声。
⑷ 指纹特征的提取与分类识别
对指纹图像模式识别问题,至少有三个用于指纹识别的分支,即结构的方法、句法方法和人工神经网络(ANN)。结构的方法,特征的提取基于指纹图像的细节。句法方法,典型的近似纹线形成原始的串,然后用产生规则形成潜在的可能串,产生规则根据使用的语法。人工神经网络则是通过相当数目的特征训练集对网络进行训练,经过学习的网络用以进行特征的提取与识别。
⑸ 指纹图像的匹配
目的是验证两个指纹是否是同一指纹。指纹对比有两种方式:(1)一指纹验证:根据用户ID从指纹库中检索出要对比的用户指纹,再与新扫描得到的指纹进行对比;(2)多指纹验证:新扫描得到的指纹和指纹库中的指纹逐一进行对比。
3.3.2 BP神经网络的数字识别过程
⑴ 图像预处理
① 灰度化:灰度化是指将图像处理成只含有亮度信息,不含有色彩信息的图像,就是把含有亮度和色彩的彩色图像变换成灰度图像的过程。
13
哈尔滨学院本科毕业论文(设计)
② 二值化:二值化就是把图像中的像素根据一定的标准划分成黑白两种颜色。即将图像上的点的灰度置为0或255,使整个图像呈现出明显的黑白效果。
③ 平滑去噪:平滑去噪就是除去孤立的噪声点、填充前景区域中的孤立白点、删除字符边缘线上的小凸起并填充凹陷,以利于后续算法的进行。
④ 归一化:由于原始图像在大小方面存在着很大的差异,必须进行归一化处理,使其具有相同的大小,有利于减少网络训练的时间,提高识别的准确率。
⑤ 细化:相同数字的几幅图像由于他们的笔画线条的粗细不同,使得他们的差别很大,将它们的笔画线条进行细化以后,统一到相同的宽度,如一个像素宽度时,这些图像的差距就不那么明显,容易提取字符的骨架特征,可以提高字符识别的效率和正确率。
⑵ 特征提取:特征提取是整个字符识别系统的关键,识别算法是根据选取特征的种类来进行选择的。所选取的特征是否稳定,是否代表一类字符的特点,是系统识别率高低的关键。对于图像识别,根据抽取特征的方法一般将其分为三类:逐像素特征提取法、结构特征提取法和统计特征提取法。
3.3.3 BP神经网络在医学检测中的应用过程
⑴ 样本数据的预处理:为了提高神经网络的训练效率,通常要对样本数据作适当的预处理。首先,对样本数据作归一化处理,使的归一化后的输入和目标数据服从正态分布;然后,对归一化后的样本数据进行主元素分析,从而消除样本数据中的多余成分,起到数据降维的目的。
⑵ 划分训练样本、验证样本和测试样本:为了提高网络的推广能力和识别能力,训练中采用“提前停止”的方法。因此,在训练之前,需要将处理后的样本数据适当的划分为训练样本集、验证样本集和测试样本集。
3.3.4 BP神经网络在语音识别系统中的实现
⑴ 分帧加窗:语音信号是一种典型的非平稳信号,随时间变化而变化,但由于语音的形成过程是与发音器官的运动密切相关的。因此在0~20ms的时间段内,语音信号的频谱特性和物理特征参量可近似看作是不变的,即可视为短时平稳的,就可以对语音信号进行分帧处理。分帧相当于对原始信号加了一个矩形窗。
⑵ 端点检测:语音信号的端点检测可以分为四段:静音、过渡段、语音段、结束。在静音段,如果能量或过零率超过了低门限,就应该开始标记起始点,进入过渡段。在过渡段中,只要两个参数的数值都回落到低门限以下。就将当前状态恢复到静音状态。而如果在过渡段中的两个参数中的任意一个超过了高门限,就可以确信进入语音段了。
⑶ 特征参数的提取:语音信号是一种典型的时变信号,特征提取的目的就是对原始
14
哈尔滨学院本科毕业论文(设计)
语音进行处理后。计算语音对应的特征参数。提取的特征参数满足如下要求:
① 特征参数能有效地代表语音特征具有很好的区分性。 ② 参数间有良好的独立性。
③ 特征参数要计算方便,要考虑列语音识别的实时实现。
语音特征参数可以是能量、基音频率、共振峰值等语音参数。目前在语音识别中较为常用的特征参数为线性预测倒谱系数(LPCC)与Mel倒谱系数(MFCC)。
3.4 BP神经网络应用于字母识别
首先获取样本,经过预处理获得点阵图像,选取图像特征,将特征输入BP神经网络,经过训练获得输出,如果没有得到预期的期望值,算出误差,调整神经网络各阶层的权值,直到得到期望值为止。识别过程如图3-2所示。
样本 预处理 点阵图像 特征提取 特征向量 选取特征 调整网络权值 权值初始化 BP网络训练 输出 比较 误差 期望输出
图3-2 识别过程图
3.4.1 样本准备
本例选用了50个手写体字母图片样本作为训练样本,用来训练BP神经网络。测试样本用来验证BP神经网络模型的识别能力。图3-3为通过画图工具绘制的样本举例。
15
哈尔滨学院本科毕业论文(设计)
图3-3 手写字母样本举例
⑴ 灰度化
本系统通过MATLAB的函数rgb2gray()来实现彩色图像的灰度化,图3.16灰度化后的图像如图3-4所示。
图3-4 灰度化后的图像
⑵ 二值化
我们可以通过im2bw()来实现图像的二值化,im2bw()中的阈值参数是和灰度图像的灰度值除以255之后的值进行比较的值,当灰度图像的灰度值除以255之后大于阈值时为白色,小于阈值时为黑色。因为通常背景较白,所以阈值设为0.7,二值化后的图像如图3-5所示。
图3-5 二值化后的图像
⑶ 锐化
在使用MATLAB函数imresize()进行锐化时,要先将原图像进行反色处理,等锐化完后在反色回归原色,这样的锐化效果较好。锐化后的图像如图3-6所示。
图3-6 锐化后的图像
⑷ 平滑去噪
由于需要识别的图像大多是通过扫描而来,所以在很多的情况下字体模糊,对识别造
16
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库07032302 BP神经网络在模式识别中的应用 贺骏鹏(4)在线全文阅读。
相关推荐: