网络语言项目中的语音技术
有计划的,以便能随着学生水平的提高,很容易地扩展,来覆盖越来越多的内容。可量测性也包括ELLS在不同的带宽条件下,在各种计算机平台(DOS, Mac, Windows, UNIX)上运行的能力。系统的便携性表明了方便地将系统扩展到其他领域,可能是其他语言的愿望,这些将在以后的阶段实现。
2.2 技术特殊标准
除了这些系统标准,技术本身也需要根据语音交流中传统使用的质量检测进行评测。这些技术特殊标准指的是语音合成的语音质量和可理解性,语音识别的词错误率和语音翻译的翻译性能。而且,我们还需要考虑单项技术的计算机要求。如实时、存储和CPU资源等重要项目,以及带宽限制。
2.3 产品特殊标准
除了这些大的标准之外,需要考虑更多的产品有关标准,如花费,产品的可利用性(在不同的平台上)以及技术支持和维护。最后,对于在网上或者CD上发布,需要考虑许可问题。这儿关键问题是许可协议,这要允许网上出现大量的,可能无法控制的副本,而每一个副本都不需要单独注册。
3.语音识别技术
语音识别模块是接收口语语音输入,并显示假定输出的可能的词序列的部分。为了计算最可能的词序列,当前技术水平大部分语音识别系统采用隐马尔可夫模型,该模型从统计上模仿音位和音位变体,将这作为口语的声音单元和操纵查找过程的发音词典。而且,统计语言模型和语法可以更进一步用来限制搜索空间。语音识别器的质量通过词错误率(Word Error Rate, WER)来判断,即错误识别的单词的百分比。但是为了解释一个系统的WER,必须考虑识别任务的困难性,这基本上可以通过四个参数来确定:说话者(说话者依赖,说话者独立,方言,非母语语音);噪音环境(close-head麦克风,声道依赖,cell电话);说话风格(孤立的,有内容的,连续的,自然的,谈话式的)和应用参数(数字,领域受限,报纸,广播电视,非受限领域)。
3.1目前中美语音处理技术的评测
这里我们为每一种技术描述了当前发展水平所实现的系统的性能,展示了这些系统的局限性,以及这些技术和我们期望不久达到的水平的接近程度。
这部分总括了语音识别系统的特征和性能,给出上文多次提到的系统的一些综合信息。这些被描述的系统许
多配置成可使用多种词汇表,多种声音和语言模型。为了比较作为底线的LVCSE中这些系统的性能,我们首先报告NISR评测结果,为了系统相互间进行比较,报告这些年语音技术的进步,该评测从80年代后期就开始执行。因为语音识别研究工作组人数非常多,论文无法描述所有现存系统。因此作者设法在规则的基础
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库网络语言项目中的语音技术(6)在线全文阅读。
相关推荐: