摘要:本發(fā)明公開了一種音視頻字幕生成方法及裝置,該方法包括:接收待生成字幕的語音數(shù)據(jù)及文本數(shù)據(jù);根據(jù)發(fā)音人韻律對所述語音數(shù)據(jù)進行切分,得到符合說話人習慣的各語音數(shù)據(jù)段;根據(jù)所述語音數(shù)據(jù)段對所述文本數(shù)據(jù)進行切分,得到與所述語音數(shù)據(jù)段對應的文本數(shù)據(jù)段;根據(jù)各語音數(shù)據(jù)段的時間信息獲取與所述語音數(shù)據(jù)段對應的文本數(shù)據(jù)段的開始時間和結(jié)束時間。本發(fā)明可以簡單高效地實現(xiàn)文本數(shù)據(jù)的顯示與語音數(shù)據(jù)的同步,使生成的字幕更完整。
- 專利類型發(fā)明專利
- 申請人科大訊飛股份有限公司;
- 發(fā)明人周明;江源;王影;胡國平;胡郁;劉慶峰;
- 地址230088 安徽省合肥市高新開發(fā)區(qū)望江西路666號
- 申請?zhí)?/b>CN201510629172.X
- 申請時間2015年09月28日
- 申請公布號CN105244022A
- 申請公布時間2016年01月13日
- 分類號G10L15/00(2013.01)I;G10L15/26(2006.01)I;




教育裝備采購網(wǎng)企業(yè)微信客服
京公網(wǎng)安備11010802043465號

