77范文网 - 专业文章范例文档资料分享平台

网络语言项目中的语音技术(9)

来源:网络收集 时间:2021-02-21 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

网络语言项目中的语音技术

(定长数字串)5000词邮包校核非特定人连续语音识别(可识别普通话与四川话两种语言)识别率达到98.73%,前三选识别率达99.96%非特定人连续语音识别口语对话功能"熊猫" (观众与"熊猫"自然对话可以了解熊猫的生活习惯、生理结构等信息)识别率超过98%清华大学计算机系EasyFlight是一个电话航班信息系统。用户使用日常生活中的口语,通过电话信道与系统进行人机交互,向系统提出请求,与系统进行对话来达成其想完成的任务。系统考虑到口语中存在大量不合语法规则的现象,用以解决口语语言中的无意义成分及词序混乱的现象。中科院声学所依赖于话者的4万6千词汉语语音识别八五攻关项目人机对话工程中科院自动化所31650词的大词汇表的认人孤立词识别系统汉语全音节识别LOADSTAR一个旅游信息检索系统,词汇量达到10,000左右,句式达到200多个,基本可以实现旅馆预定各个方面的常用对话的识别和翻译。系统中的词是能代表一个含义并且在日常口语中出现频率较高的词、习语或短语。基于问答的北京市旅游信息咨询系统(VOTIRS)面向通讯、网络和PC平台的Pattek ASR/P2.0,它应用于语音教学、电话证券查询、交易系统,电话银行,智能语音总机等语音多媒体信息查询等;
目前语音识别领域IBM在做的最好。ViaVoice是IBM公司开发的新的语音识别系统,它发展了以前的英语和其他语言的识别系统,在汉语本身的特征基础上开发了这个系统。这包括一些实际问题,如汉语重的同音字多,有声调,词界限不清楚,新词不断出现等。该系统对发音标准的讲话者语音识别准确率很高(一般是本民族的讲话者)。对于那些经过一段适应性训练后仍有轻微口音的讲话者,语音识别的效果也可以提高。然而,ViaVoice技术仍有一些缺点。它不同于人类大脑进行理解的方法,它的自适应能力和鲁棒性不是最优。这些可以从它缺乏建立低层次的听觉音位模型的能力和混淆听觉上相似的单词中看出。这样它只能用在一些简单的如有限状态和概率语法情况下。目前,目前主导语音识别发展方向的主要研究机构是IBM公司和Bell Lab(见表3)。他们均是使用的方法都是基于统计模型HMM。 HMM之所以在语音识别中应用较为成功,主要是它具有较强的对时间序列结构的建模能力。
Table 3 主导语音识别的比较
IBM (Thomas J. Waston Research Center)AT?T的B
ell Lab研究小组以往重要成员  由F.Jelinek领导,有:L.R.Bahl,负责声学模型及语言解码;R.L. Mercer,主要负责语言模型;P.A. Picheny(MIT毕业),主要负责Robust声学模型;J.R. Bellegarda,主要负责非特定人系统的处理方法

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库网络语言项目中的语音技术(9)在线全文阅读。

网络语言项目中的语音技术(9).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/jiaoyu/1189981.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: