Qwen3-TTS的开源语音克隆

Qwen3-TTS的开源语音克隆

v0.1.13 54 次浏览 2026-03-04 02:59

基于Qwen3-TTS的开源语音克隆技术。

可将文本转换成自然流畅的语音,实现近乎完美的语音复制。

本地桌面工具,配音不用在付费了

开源地址: https://github.com/jamiepine/voicebox

Voicebox 是一款本地优先的语音克隆工作室,具备类似 DAW 的功能,可用于专业语音合成。

您可以将其视为ElevenLabs 的本地化、免费开源替代方案——下载语音模型、克隆语音,并在您的计算机上生成语音。

与那些将您的语音数据锁定在订阅服务中的云服务不同,Voicebox 为您提供:

  • 完全隐私——模型和语音数据都保留在您的设备上。
  • 专业工具——多轨时间线编辑器、音频剪辑、对话混音
  • 模型灵活性——目前由 Qwen3-TTS 提供支持,即将支持 XTTS、Bark 和其他模型
  • API优先——使用桌面应用程序或将语音合成集成到您自己的项目中。
  • 原生性能——使用 Tauri(Rust)构建,而非 Electron。
  • 在 Mac 上速度超快——MLX 后端采用原生 Metal 加速,在 Apple Silicon 上推理速度提升 4-5 倍。

下载语音模型,只需几秒钟的音频即可克隆任何声音,并使用录音棚级别的编辑工具创作多声道项目。无需安装 Python,无需依赖云端,无任何限制。

×
微信二维码 扫码添加微信
QQ: 123456 点击在线咨询