网络语言项目中的语音技术
,能增扩词汇到65000词。Viavoice使用基本词汇表和你的个人语音词汇表来处理听写过程中接收的信息。
· 具有"纠错机制"。利用纠错机制,可以改变用户的个人语音文件中的数据-相似词语出现的先验概率(a prior probabilities)--从而修改系统的语言模型 (language models) 。合理地利用"纠错机制",可以使识别率不断提高。
· 带有用户的个人词汇表。最多可以增扩到65000词。纠错机制同时将未包括在基本词汇表中的术语 ( 如果有的话 ) 增加到用户的个人词汇表中。与个人语音文件共同影响系统的语言模型。b 麦克风设置引导程序(Microphone Setup):ViaVoice专门提供一套麦克风设置引导程序,以保证麦克风正常工作和语音识别的准确率。引导过程是:测试麦克风连接情况;程序根据对用户输入的数个语音的采样,自动调整麦克风音量;进行语音识别测试。c 词汇表管理器(Vocabulary Manager):若用户的某个术语经过多次纠错仍然无法正确识别,可以从词汇表管理器中删除该术语。d 注册程序(Enroolment):通过注册程序,使系统对用户(可以有多个用户注册)的发音特点进行训练,来提高系统的识别率。训练共有254句话,每句10-20字。e ViaVoice 属性(Properties):在同一个系统中,为每一个用户建立一个名字,从而保存每一个用户的个人语音文件和个人词汇表。在不同的用户使用系统时,需要先改变属性。
IBM语音开发工具(IBM ViaVoice Developers Toolkit),实现应用软件与ViaVoice内核的接口,该开发工具箱可进行口授命令和控制应用的开发,系统功能见Table 5。
Table 5 IBM ViaVoice Developers Toolkit 功能介绍
内容:功能:听写内核(Dictation Engine, SMAPI interface)实现语音听写功能声导内核(Navigator Engine)实现语音命令功能语音识别数据(Data)不含语法功能的识别命令、控制等或含语法功能的听写该开发软件箱可以下功能的研发:·建立动态命令词汇(Dynamic Command Vocabularies),并创建相应的发音(Building Pronunciations for Dynamic Command Vocabulary)和测试(Testing a Dynanic Command Vocabulary)。·扩展语法(Designing Grammars)、语法编译器(Grammar Compiler)和语法测试工具(Grammar Test Tool)。·字典建立器(Dictionary Builder,包括Accessing the Dictionary Builer,Generating a Dictionary File, Tips for Generating a Dictionary File)及音库扩增(Adding or Changing Pronunciations in Your Dictionary File);·听写应用的开发,包括C语言的语音应用编程接口(SMAP
I)、语音函数调用处理,语音引擎的Session共享(Session Sharing)、并行API调用(Parallel Session API Calls)和AMAPI编程开发用的头文件和库函数等。
Table 6 ViaVoice在网络语言教学中的问题:
存在的问题解决方
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库网络语言项目中的语音技术(11)在线全文阅读。
相关推荐: