中国电信申请方法及装置、非易失性存储介质、电子设备专利,解决声音转换效率较低的技术问题

admin 2025-01-04 116人围观 ,发现151个评论

金融界2024年4月10日消息,据国家知识产权局公告,中国电信股份有限公司申请一项名为“方法及装置、非易失性存储介质、电子设备“,公开号CN117854522A,申请日期为2023年12月。

专利摘要显示,本申请公开了一种方法及装置、非易失性存储介质、电子设备。其中,方法包括:根据第一特征和第二特征确定原始音频的内容特征;利用预训练的目标基频预测模型对原始音频的基频、静音标识、内容特征以及说话人特征进行处理,得到原始音频对应的预测基频;利用先验编码器确定内容特征、预测基频以及静音标识对应的第一分布函数,并利用预训练的流模块确定第一分布函数和说话人特征对应的第二分布函数;利用预训练的目标解码器对第二分布函数、说话人特征和/或校正后的预测基频进行处理,得到转化音频。本申请解决了由于相关的声音转换方法需要对转换模型和声码器分别进行训练,以确定待转换音频对应的目标音频,造成声音转换效率较低的技术问题。

本文源自金融界

猜你喜欢
    不容错过