金融界2025年5月16日消息,国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“基于多模态风格嵌入的语音合成方法、装置、设备及介质”的专利,公开号 CN119993114A,申请日期为 2025 年 2 月。
专利摘要显示,本申请提供一种基于多模态风格嵌入的语音合成方法、装置、设备及介质,涉及计算机技术领域。本申请方法通过第一编码器对多模态特征进行特征提取和融合,生成语音嵌入数据,有助于捕捉和保留原始语音信号中的风格和情感特征。通过第二编码器对音素数据进行特征提取,生成文本特征数据,有助于理解文本内容并将其转化为可合成的语音信号。通过特征融合模型将语音嵌入数据和文本特征数据结合起来,生成风格化语音数据,在合成语音时同时考虑语音的自然度和文本的风格,从而在零样本语音合成中实现更丰富、更自然的风格多样性。
天眼查资料显示,平安科技(深圳)有限公司,成立于2008年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本531031.58万人民币。通过天眼查大数据分析,平安科技(深圳)有限公司共对外投资了4家企业,参与招投标项目282次,财产线索方面有商标信息85条,专利信息5000条,此外企业还拥有行政许可20个。
来源:金融界