TTS - 搜索 News

在线教程丨石矶娘娘秒变「川渝妹子」？Step-Audio-TTS实现语音克隆 ...

作者：大头编辑：李宝珠转载请联系本公众号获得授权，并标明来源HyperAI超神经官网上线了「Step-Audio-TTS-3B 产品级方言语音生成模型」教程，教程可实现语音合成、音乐合成和语音克隆 3 个功能，快来亲身体验一下吧~DeepSeek ...

1 天

征稿｜CVPR2025首届ViSCALE研讨会，探寻计算机视觉的推理扩展律

来自清华大学、牛津大学、UCSC、UCLA、中科院等顶尖高校及学术机构的学者届时将联合举办 CVPR 首届计算机视觉推理扩展研讨会（Test-time Scaling in Computer Vision, ViSCALE）。本次研讨会旨在深入探讨 ...

腾讯网1 天

Llasa TTS：基于LLAMA 8B 大模型微调，打造顶尖语音克隆效果

今天要为大家隆重介绍一款在语音合成领域取得重大突破的新型 TTS 模型—— Llasa 8B。这款模型由香港科技大学（HKUST）倾力打造，基于强大的 LLaMA 8B 大语言模型进行微调，专注于实现极致的语音克隆效果，并支持令人惊艳的中英双语生成能力。Llasa 8B 并非横空出世，它巧妙地选择了 Meta 公司开源的 LLaMA 8B ...

11 小时

AI说书媲美真人！豆包语音大模型升级长上下文理解

实际上这两个小说片段都是AI合成的，方案来自于豆包语音模型团队。为了逼近一流真人主播的演播效果，豆包语音模型基于原有Seed-TTS框架进一步加入上下文理解，最终实现了高表现力、高自然度、高语义理解的小说演播效果。

11 小时

豆包语音模型优化小说演播，大咖音色媲美真人

豆包语音模型优化小说演播，大咖音色媲美真人,小说,豆包,上下文,tts ...

6 天

最新Zonos TTS模型揭秘：5-30秒高保真语音克隆

Zonos由总部位于加利福尼亚州帕洛阿尔托的Zyphra公司推出，这款新型的TTS模型融合了深度学习和神经网络等尖端技术。核心使用基于Transformer的混合架构，使得克隆出的语音更加自然且富有表现力。据悉，Zonos模型能够在仅需5到30秒的音频样本下，生成44KHz的高质量音频。通过对大约20万小时的语音数据的训练，Zonos具备了多种语言和情感表达能力，满足用户在不同场合的语音需求。

6 天

Zyphra推出高保真语音克隆技术，推动TTS领域革命

Zyphra的产品定位清晰，旨在为媒体内容、娱乐和教育等多个领域提供高质量的语音解决方案。该公司以Apache2.0许可证发布Zonos模型，意味着这一技术将开放给广大的开发者和企业进行测试与尝试。这不仅促进了TTS行业的技术共享与发展，也为用户带来了更多创新的想法和解决方案。根据最新研究，市场对高保真语音生成的需求持续增长，Zyphra凭借其创新的技术和开放的研发策略，正处于把握市场机遇的前沿。

搜狐21 天

2025 最佳免费商用文本转语音模型： Kokoro TTS

Kokoro TTS 的模型权重可直接下载，相关代码和部署文档也都在 Hugging Face 平台上免费提供。开发者只需几行代码即可快速上手，体验高质量的语音 ...

CTI论坛15 年

语音合成技术的原理

当前，语音合成的研究已经进入文字－语音转换（TTS）阶段，其功能模块可分为文本分析、韵律建模和语音合成三 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果