聊天箱

Premium

以23种语言进行表达式讲话的零弹音克隆

Fast 速度
Very Good 质量
克隆
23 语文

关于 聊天箱

聊天盒是来自重塑的AI的强大声音克隆 TTS 模型。 它从仅几秒钟的参考音频中进行零光声音克隆,以自然表达方式支持23种语言。 聊天盒包括了语言标签,用于添加自然声音,如笑声和咳嗽等自然声音。

关键关键特征

零热声音克隆

以几秒钟的音频 来打开任何声音 不需要训练

23 语文

从阿拉伯文到中文,涵盖世界多数主要语言。

信号信号标记

添加[拉 [咳,[抽 自然的单语声音。

快速推断

与实时应用的涡轮变异的分200米的延绳。

使用案例

制作内容的语音克隆 多语言语音应用程序 游戏字符语音设计 个人化语音助理

如何使用 聊天箱

  1. 1

    签名或打开演示

    创建免费的 TextToSpeechAI 账户, 以要求200 个启动贷款, 或者使用页面演示 尝试聊天器框, 无需签名 。

  2. 2

    选择聊天框并添加引用剪贴

    选择聊天盒引擎, 然后上传一个简短( 几秒钟) 的音频剪辑, 即您想要克隆的声音。 聊天盒零弹克隆即刻进行 - 不需要训练 。

  3. 3

    输入带有可选标签的文本

    输入或粘贴文本,以23种辅助语言中的任何一种语言发言,并投放到[拉 、[咳 或[打 标签,只要你想听自然的多语种声音。

  4. 4

    生成演讲

    点击生成, TextToSpeechAI 将您在主机 GPU 基础设施的克隆聊天盒语音中 输入文字, 花费每千个字符25分。

  5. 5

    下载或使用 API

    下载已完成的音频文件, 或使用您的账户符号通过 api. texttospeechai. com 上的 TextToSpeechAI REST API 自动生成 。

聊天箱 API API API AIP AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIP AL ALIPI

以TextToSpeechAIREST API 生成有计划的语言。

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "聊天盒可以复制你的声音 从几秒钟的音频 并用23种语言说话。",
    "voice": "en_US-lessac-medium"
  }'

常问问题

聊天盒是来自AI 的“重新组合”的零发话式克隆文本到语音模型。 它可以复制任何仅几秒钟的音频参考,用23种语言生成自然的、直言不讳的演讲,而没有经过任何逐个声音的培训。

是的,聊天盒完全由麻省理工学院颁发许可证,包括代码和模型重量,这样你就可以在商业产品中自由使用。 生成的音频包括一个可以禁用的可选神经水印,没有使用权。

聊天盒将声音的细微和风格提取到一个发言者嵌入中。然后在那个声音中生成全新的演讲,没有微调或训练步骤,这就是“零弹”的意思。

聊天盒读取文本中的特殊内嵌标签,添加自然的非语言声音:[拉 插入笑声,[咳 插入咳嗽,[打 插入软的低锁。您只需在声音的位置贴上标签,比如“这是热闹的[拉 但严重的...”。

直接输入文字中的标签, 输入到声音应发生的位置, 周围是您句子的其余部分。 聊天框将克隆声音中的比语言声音转换成, 将其融入周围的演讲中, 使声音听起来像自发的而不是被拼接的。

查特文箱支持23种语言,包括阿拉伯文、丹麦文、德文、希腊文、英文、西班牙文、芬兰文、法文、希伯来文、印地文、意大利文、日文、韩文、马来文、荷兰文、挪威文、波兰文、葡萄牙文、俄文、瑞典文、斯瓦希里文、土耳其文和中文。 单一克隆声音可以使用这些语言。

聊天盒快速生成GPU的语音,而涡轮变异功能则达到二千万分悬浮,用于实时交谈。 质量非常好,自然的手动和忠实的语音复制来自短短的参考剪辑。

聊天箱需要大约4-8GB VRAM 的 4- 8GB 的 变体, 涡轮模型在大约 4GB 中运行得舒适。 TextToSpeechAI 时, 您不需要本地 GPU - 由我们主机基础设施运行的 GPU 。

聊天盒是一种高价引擎,每1000个字符要花费25分。 新账户可以免费获得200分,用于语音克隆,而你只花在实际生成的文本上。

这两种语言都支持零点声音克隆,但聊天箱覆盖的语言(23对2)要多得多,并增加了表达式旁语标记(23对2 ) 。 F5-TTS可以略微排除自然的英语手法,因此选择多语言克隆和表达式声音的聊天箱,以及只对英语忠实的F5-TTS。

这两种语言都提供高质量的语音克隆。 聊天盒支持23种语言和内线表达标签,而 OpenVoice则增加了查特盒子所缺少的音调风格控制(友好、悲伤、愤怒和更多 ) 。 选择聊天盒用于广泛的语言覆盖,当您需要明确的情感语调时选择开放盒和开放声音。

是的。 注册一个免费的 TextToSpeechAI 账户, 以接收200 个启动分, 或者使用 页面演示来不签名就听聊天框。 上传一个简短的参考剪辑, 输入您的文本, 并在秒内生成一个克隆声音 。

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try 聊天箱 Now

Generate your first audio free. No credit card required.

Start Free