腾讯公司取得语音识别模型训练专利,能自动化形成相应的发音序列,减少遗漏发音信息,提高训练的准确性

2024/05/11 11:41来源:第三方供稿

金融界2024年5月11日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“一种语音识别模型训练方法、装置、电子设备及存储介质“,授权公告号CN112185361B,申请日期为2020年9月。

专利摘要显示,本发明提供了一种语音识别模型训练方法装置、电子设备及存储介质,方法包括:基于文本的目标类型对所述待识别音频信息对应的标注文本信息进行预处理;在第一发音词典中添加所述目标类型的文本信息对应的发音,形成第二发音词典;基于所述第二发音词典,生成与所述待识别音频信息对应的标注文本信息相匹配的发音序列;确定训练样本集合;确定所述语音神经网络的模型参数,由此,可以通过云技术将广域网或局域网内将硬件、软件及网络等系列资源统一起来,能够自动化的形成相应的发音序列,形成训练样本集合对语音识别模型进行训练,减少由于错误的发音或者遗漏发音信息,影响语音识别模型训练的准确性。

编辑:Lisa