摘要: 维吾尔语是一种黏着语, 单词不太适合作为维吾尔语大词汇连续语音识别系统识别单元。针对维吾尔语大词汇连续语音识别系统中的识别单元选择问题, 设计更适合维吾尔语的子词识别单元, 提出维吾尔语单词和子词相结合的组合识别单元构建方法, 并对单词、子词和组合识别单元的语言模型和语音识别性能进行评价。实验结果表明, 所提出的识别单元在单元数量、语言模型复杂度等方面表现出更加优越的性能, 并且使识别系统的单词错误率比基于单词的系统相对减少22%。
中图分类号:
努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木,热依曼.吐尔逊. 维吾尔语大词汇语音识别系统识别单元研究[J]. 北京大学学报(自然科学版).
Nurmemet Yolwas,Wushour Silamu,Reyiman Tursun. Research on Recognition Units of Large Vocabulary Speech Recognition System of Uyghur[J]. Acta Scientiarum Naturalium Universitatis Pekinensis.