搜索引擎 + AI 驱动的行业新闻
【覆盖行业】
信保 |出口 |金融
制造 |农业 |建筑 |地产
零售 |物流 |数智
【访问入口】
hangyexinwen.com
【新闻分享】
点击发布时间即可分享
【联系我们】
xinbaoren.com
(微信内打开提交表单)
【覆盖行业】
信保 |出口 |金融
制造 |农业 |建筑 |地产
零售 |物流 |数智
【访问入口】
hangyexinwen.com
【新闻分享】
点击发布时间即可分享
【联系我们】
xinbaoren.com
(微信内打开提交表单)
📰 网易有道首发14语种零口音语音克隆模型,无需参考文本即可复刻任意音色-品玩
在国家层面将人工智能定位为新质生产力的核心引擎的背景下,网易有道推出“子曰4.0”大模型体系Confucius4-TTS,并向全球开放完整权重与工具链。该引擎具备54G资源包的本地离线部署能力,采用1.3B参数的高性能语音模型,提供零样本语音克隆、跨语种无痕音色迁移与情感复刻等三大突破,且以Apache开源协议开放,商业使用无限制。核心创新包括:三秒级零样本音色克隆,克隆相似度高、准确度高;14种语言跨语种互通,解决中式口音问题,使中文音色可自然表达日语、英语等外语;音频Prompt情感克隆,实现跨语种的情感语调迁移。底层由大模型驱动的全栈架构替代传统声码器,采用GPT式主干、可学习说话人编码器与Flow Matching框架,提升高保真与自然度。自开源以来,社区反馈积极,开发者可完全下载使用,开源生态有望催生多语种内容创作、数字人配音及本地化运营的新场景。网易有道表示将通过全面开源降低门槛,推动产业落地与创新探索。
🏷️ #人工智能 #跨语种 #语音克隆 #开源 #本地部署
🔗 原文链接
📰 网易有道首发14语种零口音语音克隆模型,无需参考文本即可复刻任意音色-品玩
在国家层面将人工智能定位为新质生产力的核心引擎的背景下,网易有道推出“子曰4.0”大模型体系Confucius4-TTS,并向全球开放完整权重与工具链。该引擎具备54G资源包的本地离线部署能力,采用1.3B参数的高性能语音模型,提供零样本语音克隆、跨语种无痕音色迁移与情感复刻等三大突破,且以Apache开源协议开放,商业使用无限制。核心创新包括:三秒级零样本音色克隆,克隆相似度高、准确度高;14种语言跨语种互通,解决中式口音问题,使中文音色可自然表达日语、英语等外语;音频Prompt情感克隆,实现跨语种的情感语调迁移。底层由大模型驱动的全栈架构替代传统声码器,采用GPT式主干、可学习说话人编码器与Flow Matching框架,提升高保真与自然度。自开源以来,社区反馈积极,开发者可完全下载使用,开源生态有望催生多语种内容创作、数字人配音及本地化运营的新场景。网易有道表示将通过全面开源降低门槛,推动产业落地与创新探索。
🏷️ #人工智能 #跨语种 #语音克隆 #开源 #本地部署
🔗 原文链接