Fast
速度
Very Good
质量
是
克隆
10
语文
关于 二十三至三三
阿里巴巴的 Quen3-TTS 是 0.6B 参数 文本到 语音模型, 将 高质量 和 有效 推论 相结合 。 它支持 10 种语言, 并且可以从 3 秒的 音频 复制任何声音 。 它建在 Quen3 结构上, 在所有 支持 的 语言中 制作 出 精美的 手动和发音 。
关键关键特征
3 - 第二声音克隆
仅仅从3秒钟的音频 就能打开任何声音 即是这个行业最快的克隆
10 语言
中文、英文、日文、韩文、法文、德文、西班牙文、意大利文、葡萄牙文和俄文。
有效推断
0.6B 快速推断参数,同时保持高质量产出。
自然状态
建在昆特3号建筑上 用来用适当的国名 进行自然声音演讲
使用案例
多语言内容创建
快速语音克隆原型
地方化和组合
语音助理应用程序
如何使用 二十三至三三
-
1
免费签名或使用演示
创建一个免费的 TextToSpeechAI 账户以获取初始学分, 或者先尝试不签名演示。 不需要 GPU 或本地安装 Quen3- TTS, 即所有设备都在我们的服务器上运行 。
-
2
选择 wen3- TTS 并添加三秒剪裁
选择 Quen3- TTS 做为您的引擎, 由声音拾取器来选择。 要克隆一个声音, 上传一个大约3秒的干净参考剪辑; 对于一个非克隆的声音, 只要选择一个内置的 Quen3- TTS 声音 。
-
3
输入您以任何10种语言编写的文本
英文、日文、韩文、法文、德文、西班牙文、意大利文、葡萄牙文或俄文的文字类型或粘贴。 Quen3-TTS可以在所有10种辅助语言中讲您的克隆声音。
-
4
生成演讲
点击生成并合成 Quen3- TTS 。 点击生成并合成您在我们的 GPU 上的音频, 其级别为溢价级( 每1000 个字符25 个分)。 缩写 0. 6B 模式快速返回自然多语种语言 。
-
5
下载或使用 API
预览结果, 然后下载音频文件, 或者通过 api. texttospeechai. com 上的 TextToSpeechAI API 程序获取。 将相同的克隆 Quen3- TTS 声音重新用于后代 。
二十三至三三 API API API AIP AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIP AL ALIPI
以TextToSpeechAIREST API 生成有计划的语言。
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "253\u002DTTS提供以超快3秒语音克隆进行自然多语种语言演讲。",
"voice": "en_US-lessac-medium"
}'
常问问题
Quen3-TTS 是Alibaba在Quen3 结构上建构的文字到语音模型。 它支持10种语言, 并且可以从3秒钟的参考音频复制任何声音, 产生具有强烈的手动和发音的自然声音。
是的。 Quen3-TTS根据许可的Apache 2. 0许可证,以其代码和模型重量来发放,这意味着您可以自由地在商业产品中使用它,而不必支付使用费或面临非商业限制。
Quen3-TTS支持10种语言:中文、英文、日文、韩文、法文、德文、西班牙文、意大利文、葡萄牙文和俄文。 单一克隆声音可以使用这些语言,这使得Quen3-TTS非常适合本地化和多语种内容。
是的。 Quen3-TTS可以复制3秒钟的音频参考声音,这是任何TTS系统最快的克隆要求之一。 一个干净、无噪音的短片效果最好,5至10秒的短距参考可以稍微提高忠诚度。
Quen3-TTS 是一个 0.6B 的紧凑参数模型, 所以推论是快速的, 而质量则保持良好 。 Quen3 结构让它自然的 编译和精确的发音覆盖了所有 10 种支持的语言 。
253-TTS在VRAM 4-8GB 4-8GB 运行,这归功于其小的 0.6B 参数足迹。 推荐给主机室使用6GB或以上GPU, 尽管在TextToSpeechAI 上您不需要任何硬件, 因为一代人运行在我们的 GPU 服务器上。
Quen3-TTS是一台高价引擎,每1000个字符计25个分,反映了其语音克隆和多语言能力,同时比乌龟或SsteleTTS2等超级引擎便宜。
这两种模型都是具有语音克隆的阿里巴巴模型,而且都处于高级水平。 Quen3-TTS支持更多的语言(10对5),需要的参考音频较少(3对3对10),而CosyVoice2可能将其放在中国质量上。 想要最广泛的语言覆盖和最快的克隆,就选择 Quen3-TTS。
在TextToSpeechAI个克隆引擎中,Quen3-TTS在其3秒的克隆要求和10种语言的覆盖方面显得非常突出。 F5-TTS和聊天盒也复制了声音,但取舍却不同,因此在短短的样本中尝试几个是最容易选择的方法。
昆士兰—TTS(Quen3-TTS)对于多语言内容创建、本地化和调试、快速语音克隆原型和语音助理应用程序来说是理想的。 它能够将一个克隆声音带入10种语言,因此对全球项目特别有用。
TextToSpeechAI 上不需要安装。 我们用 GPU 基础设施托管 Quen3- TTS, 这样您就可以在浏览器中或通过我们的 API 直接复制声音和生成语音, 而不用自己设置模型、 重量或依赖性 。
是的。 您可以在 TextToSpeechAI 上尝试 Quen3- TTS, 使用我们的免费演示和免费启动分, 不需要 GPU 或设置。 签名从三秒的剪辑中克隆一个声音, 并生成多语言语言的语音, 然后升级 。
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 10
- GPU VRAM 4-8GB
- Credits/1000 chars 25