网络语言项目中的语音技术
统等等,都取得好的成果。调查表明,85%以上的人对语音识别的信息咨询服务系统性能表示满意。我国语音识别研究工作主要是从上世纪八十年代中期开始,主要的研究单位包括清华大学计算机系、电子工程系、中科院声学所、中科院自动化所。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。之后得到了包括"985"、"973"、"九五"攻关、国家自然科学基金等在内的多项国家研究计划和中科院知识创新工程的支持。Table1 and Table 2 are 国内外语音识别系统的概况. 中文语音识别的研制和开发的厂商有:IBM、Microsoft、Speechworks、Nuance、Philips、Infotalk、Pattek, GR&T, d-Ear Technologies,英语语音识别包括IBM , Dragon Natural Speaking 6 (now ScanSoft),微软, SRI/Nuance 通信 = DECIPHER, At&T 贝尔实验室 (Lucent Tech.), BBN - BYBLOS, CU-HTK, Janus, SPHINX, 厂商包括: Philips, Nuance, SpeechWorks, IBM, MS, ScanSoft.
表1和表2展示了中国和海外的语音识别系统。
Table 1: 国外主要语音识别系统
系统或组织条件识别性能CMU SPHINX1000个单词,中等语法适应说话人的连续语音识别识别率91.1%。Air Travel Information Service, 系统鲁棒性非常强,能够有效地处理自发口语的各种现象。在1995年的ARPA-ATIS测试中与AT&T的CHRONUS一道以错误率仅3.8%名列前茅。对997个词的连续语音在有文法限制的条件下识别率为96.8%,音素识别率为73.8%。INRS依赖于话者,75000词汇的识别率为89.5%。IBM Tangora(美式英语)依赖于话者5000词汇识别率为97.1%可识别英式英语、法语、德语、意大利语、西班牙语以及日语, 不依话者20000词汇识别率为94.6%IBM ViaVoice不依话者32000中文词识别率为95%ViaVoice是Tangora系统的中文版。M.Miyatake et alTDNN综合训练2620字查找音素的正确率为98.0%用预测神经网络模型,5240个普通日语字识别率为92.6%Hild对依话者1000个句子多态TDNN,
对120人不依话者的1680个字识别率为98.5%,
识别率是92.0%,SPHIX是96.0%
SPHIX为90.4%。H.Sawai基于TDNN-LR-DP的混合法,对5000词。识别率达92.6%K.Iso et al预测神经网络,依话者5000词汇识别率达97.6%具有很强的建模能力,可用于连续语音和非特定人Table 2 国内主要识别系统
研发单位系统性能指标清华大学电子工程系专用芯片识别30条特定人语音命令识别率超过95%
基于统计理解方案的汉语全音节语音识别系统--"知音文书处理系统"。识别率超过95%非特定人汉语数码串连续语音识别(在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串))识别精度94.8%(不定长数字串)和96.8%
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库网络语言项目中的语音技术(8)在线全文阅读。
相关推荐: