腾讯公司申请远场语音增强处理专利,提升语音增强处理模型的降噪去混响效果

admin 2025-02-24 75人围观 ,发现36个评论

金融界2024年1月9日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“远场语音增强处理方法、装置、计算机设备和存储介质“,公开号CN117373468A,申请日期为2022年6月。

专利摘要显示,本申请涉及一种远场语音增强处理方法、装置、计算机设备和存储介质。所述方法涉及云技术,包括:获取携带有噪声数据和混响数据的远场语音数据,提取远场语音数据的带噪语音特征,基于训练好的语音增强处理模型,确定与带噪语音特征对应的纯净掩码,根据纯净掩码和带噪语音特征进行降噪去混响处理,获得远场语音数据中的纯净语音。训练好的语音增强处理模型,根据预先训练的第一降噪去混响模型,对预先训练的第二降噪去混响模型进行知识蒸馏训练得到。采用本方法可使得第二降噪去混响模型,学习到层级节点数更大的第一降噪去混响模型的性能,减少模型训练量和计算量,提升语音增强处理模型的降噪去混响效果,以及对纯净语音数据的语音识别准确度。

本文源自金融界

猜你喜欢
    不容错过