!!"!
!"#$%&’())*(+,)-".,/,,0112
设计程序界面采用R+&‘+KP的cdQ技术。程序采用先录音后处理方式(非实时处理),录音长度预先设定,语音之间允许插入一定的静音间隔以保证可懂性,录音结果和处理结果都能够及时回放,并显示处理前后的波形。
采用双门限算法,对整个录音段连续检测,从而获得所有的有效语音段,并加以剪切,合并,最后形成连贯的有效语音语音是“?@0@C@a”的发声,段。图?P的例子中为2.2秒的录音,取处理静音间隔为1,处理结果波形如图0所间隔约为1./秒,
示,时长为?.a/秒,语音完整,没有断音现象。为了显示方便,这里只取了2.2秒的录音,实际应用中,时间可能会长得多,录音源也可能多种多样(如录音笔等数字设备),处理结果还可能需要保存,因此涉及到文件的操作,此时,只需将录音函数改为读efg文件函数(9h6(’hi)并增加写efg文件函数(9+69(j&’)即可。
@?
!语音信号的显示和回放可以用以下命令实现:
3"%456789:;<=3>
,,,,"语音处理中,为了消除低频干扰通常要进行预加重滤
波,数学表达式为?@+A,其中+一般为1.BCD1.B/,可用以下滤波命令实现:
;E=7F&8(GH?,@+I<?<;>
,,,,还要对信号进行分帧处理,可以使用#要计算短时能量,
LE84=(+M8:;<,N(+M8O84<PN(+M8Q4J>
6"7J8,K";工具箱中的84=(+#8函数:
其中;为原始信号,N(+#8O84为指定帧长,N(+#8Q4J为指定帧数组每行为一帧数据。移,L为分帧后形成的二维数组,
这里需要说明,需从6"7J8,K";为一个免费的第三方软件,网上下载后加入到R+&F+K的搜索路径才可使用。
$短时能量可以简单地用以下命令实现:
+#$?E3%#:+K3:;><0>+#$0E3%#:;.S;<0>
,,,,可以用以下程序实现:%过零率的计算相对复杂一些,
TJ(,E,T8("3:37T8:L<?><?>U58F&+,E,1.10U,,V,设定的门限="(,7E?W37T8:L<?>;,E,L:7<W>U="(,XE?WF84Y&Z:;>@?
7=,;:X>S;:X[?>,\,1,])+K3:;:^>@;:^[?>>_5’‘&+TJ(:7>PEPTJ(:7>[?U845845845
PPPP运行速度较慢(R+&‘+K的&上面的程序用到了嵌套循环,
图?PP端点检测扫描结果
具有弱点)。以下的矢量化算法更加适合R+&‘+KP的计算方式,较高的计算效率:
&M$?PEP84=(+M8:;:?W845@?><PN(+M8O84<PN(+M8Q4J>U&M$0PEP84=(+M8:;:0W845><PN(+M8O84<PN(+M8Q4J>U37Y43PEP:&M$?.S&M$0>\1U57==3PEP:&M$?@&M$0>_1.10UTJ(PEP3%M:37Y43.S57==3<P0>U
PPPP该算法的巧妙之处在于:因&M$?与&M$0相差一个样点,
图0PP语音处理后回放结果
此当两者的乘积小于1时(第C行),表明相邻样点异号,37Y43取(否则取1。而当两者的差值大于1.10时(第a?即过零),行),表明相邻样点差值大于门限,否则取1。57==3取?,37Y43与
aP结束语
由于R+&‘+K编程简便,计算中有很多现有的函数可以利用,更有一些免费的第三方工具的支持,结果可视化也简单易行,因此将其用于语音处理的各种算法实验,具有良好的效果。
参考文献:
57==3乘积之和即为同时满足两个条件的过零率结果。
不同场景的信号平均幅度变化很大,较难确定合理的最小门限,通常还需要先将输入信号进行归一化,将其幅度限制在用以下命令实现:H@?,?I之间,;E;bM+;:+K3:;>>。
CP应用实例
本实例针对采访录音的整理进行设计。在采访中,由于被采访人对所提问题需要一定的时间进行思考,造成录音中无声(间隙)部分太多,内容不紧凑,也浪费空间。通过语音端点的检测,可以正确地识别出有效的语音部分,而将过长的无声部分和无声段中一些短暂的干扰信号剔除掉,使语音更为连贯。
H?IPH美I拉宾纳OPk<谢弗奢kPe<朱雪龙等译.语音信号数字处理.科学
出版社<?B/C.
H0IP何强<何英.R+&‘+K扩展编程.清华大学出版社<0110.
HCIP果永振<何遵文.一种多特征语音端点检测算法及实现.通讯技术<
011C.?.
HaIP李强<赵伟.R+&‘+K数据处理与应用.国防工业出版社<011?.
lPP
m
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库语音端点检测及其在Matlab中的实现(2)在线全文阅读。
相关推荐: