金融界2024年3月27日消息,據國家知識產權局公告,科大訊飛股份有限公司申請一項名為“語音識別方法、裝置、電子設備和存儲介質“,公開號CN117765932A,申請日期為2023年12月。
專利摘要顯示,本發明提供一種語音識別方法、裝置、電子設備和存儲介質,其中方法包括:獲取待識別語音;確定所述待識別語音中各語音幀所屬音素的預測難易程度,基於與所述預測難易程度對應的特征提取方式,提取所述各語音幀的語音特征;基於所述各語音幀的語音特征,確定所述待識別語音的識別結果。本發明提供的方法、裝置、電子設備和存儲介質,通過確定待識別語音中各語音幀所屬音素的預測難易程度,基於與預測難易程度對應的特征提取方式,提取各語音幀的語音特征,以得到待識別語音的識別結果,實現了難易漸進式語音識別,提升了針對較困難語音片段的語音識別效果。