CORC  > 清华大学
段长在汉语识别系统后处理阶段的应用
李曜 ; 刘加
2010-07-15 ; 2010-07-15
会议名称第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集 ; Abstract Book of the 10~(th) National Conference on Man-Machine Speech Communication (NCMMSC'2009) and International Symposium on Speech and Language Processing ; 第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会 ; The 10~(th) the National Conference on Man-Machine Speech Communication (NCMMSC'2009) and International Symposium on Speech and Language Processing ; 中国甘肃兰州 ; CNKI ; 中国中文信息学会语音信息专业委员会、中国声学学会语言、听觉和音乐声学分会、中国语言学会语音学分会
关键词语音识别 后处理段长模型 段长归一化 speech recognition post-processor duration model duration normalization TN912.34
其他题名Using duration model in the post-processing stage of mandrin speech recognition system
中文摘要针对传统的隐含马尔可夫模型(hidden Markov model,HMM)存在的缺陷,该文提出了一种在识别的后处理阶段使用段长模型的方法,并应用在基于HMM的汉语识别系统上。该方法利用归一化的段长模型对识别系统的解码结果重新打分,比较前后两次算出的分数从而选出更可靠的识别结果。实验表明,通过该方法将段长模型应用在识别过程中,可以显著提高识别系统的性能,大量减少识别结果中的插入错误。数据显示,该方法使识别系统的音节错误率下降了大约10%,识别系统最终的插入错误和删除错误都低于1%。; Aiming at the defects of traditional Hidden Markov Model (HMM), a novel method of using duration Model in the post-processing stage is proposed in this paper and applied to a mandarin speech recognition system based on HMM. The best candidate from the decoder is rescored by the normalized duration model and more credible results are obtained by comparing the two different scores. The error rate of syllable is decreased by 10% and the improvement of the insertion error rate is especially significant, which indicates that the method works well on the speech recognition system and is especially effective to reduce the error rate of insertions.; 国家自然科学基金委员会与微软亚洲研究院联合资助项目(60776800); 国家高技术研究发展计划(863计划)项目(2006AA010101,2007AA04Z223)
会议录出版者清华大学
语种中文 ; 中文
内容类型会议论文
源URL[http://hdl.handle.net/123456789/69804]  
专题清华大学
推荐引用方式
GB/T 7714
李曜,刘加. 段长在汉语识别系统后处理阶段的应用[C]. 见:第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集, Abstract Book of the 10~(th) National Conference on Man-Machine Speech Communication (NCMMSC'2009) and International Symposium on Speech and Language Processing, 第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会, The 10~(th) the National Conference on Man-Machine Speech Communication (NCMMSC'2009) and International Symposium on Speech and Language Processing, 中国甘肃兰州, CNKI, 中国中文信息学会语音信息专业委员会、中国声学学会语言、听觉和音乐声学分会、中国语言学会语音学分会.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace