摘要:本發(fā)明涉及一種語音識別系統(tǒng)中拒識能力提升方法,步驟為:收集各種各樣的噪聲數據;按噪聲種類進行分類;再針對不同類別的噪聲分別訓練高斯混合模型(GMM);最后組合各類GMM模型為整體的吸收模型;通過各種比較隨意的文本訓練統(tǒng)計語言模型,然后通過加權有限狀態(tài)機(WFST)技術構建識別網絡,稱之為吸收網絡;將吸收網絡和吸收模型同原始解碼網絡并聯,形成新的解碼網絡;將輸入的原始音頻經過端點檢測以及特征提取模塊,生成特征向量;特征向量在解碼網絡的三個部分中根據Viterbi算法進行競爭,生成最終的識別結果,噪聲以及集外詞能夠得到有效的拒識。本發(fā)明在兼顧識別效率的前提下,很好解決了對于集外詞以及無效輸入的拒識問題。
- 專利類型發(fā)明專利
- 申請人安徽科大訊飛信息科技股份有限公司;
- 發(fā)明人鹿曉亮;趙志偉;陳旭;尚麗;吳曉如;于振華;
- 地址230088 安徽省合肥市高新開發(fā)區(qū)望江西路666號
- 申請?zhí)?/b>CN201210581426.1
- 申請時間2012年12月27日
- 申請公布號CN103077708A
- 申請公布時間2013年05月01日
- 分類號G10L15/14(2006.01)I;G10L15/30(2013.01)I;G10L15/06(2013.01)I;




教育裝備采購網企業(yè)微信客服
京公網安備11010802043465號

