乌龟 TTTS

Ultra

具有与自然无比性格的超高质量演讲

Very Slow 速度
Exceptional 质量
克隆
1 语文

关于 乌龟 TTTS

TTS是一种自动递减的文字到语音模型,它把音质放在所有其它方面之上。 托托伊斯结合了自动递减变压器和传播模型,产生了非常自然的言语,捕捉了人类声音的微妙细微差别。 托伊斯虽然比其他模型慢,却产生了最自然的 TTS 输出。

关键关键特征

超高质量

现有最自然的 TTS 输出。

语音克隆

以非凡的忠诚和微妙 来发扬光大的声音

自然状态

捕捉微妙的言语模式和微表达方式

质量预设

从超快到高品质的处理中选择 。

情感深度

以真正的情感共鸣 产生演讲

开放源码

Apache 2. 0 持有商业使用权许可证。

使用案例

音传 电影制制制 纪录片叙述 专业语音电话 档案项目 高端内容

乌龟 TTTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

如何使用 乌龟 TTTS

  1. 1

    签名或尝试免费演示

    创建一个免费的 TextToSpeechAI 账户以获得初始学分, 或者使用主页演示来尝试不签名的乌龟。 乌龟是一个超层引擎( 每1000 个字符50 个学分), 因此免费学分在第一个短时间测试时是完美的 。

  2. 2

    选择乌龟, 并选择将声音添加到克隆

    从语音浏览器中选择乌龟的声音。 要克隆某个特定的人, 请上传一个参考剪辑( 最好有几个干净的5- 10秒样本), 乌龟会以高度忠诚的方式复制这个声音 。 否则, 选择一个内置的乌龟声音 。

  3. 3

    输入文本

    输入或粘贴您想要说明的文本。 因为乌龟速度缓慢, 开始用短短的一段来确认声音和语气, 然后发送完整的音频簿章节或长脚本 。

  4. 4

    选择质量预设并生成

    选择 乌龟 质量 预设 : 快速 测试超快, 速度/ 质量平衡要快( 推荐默认), 标准, 或 质量 质量, 最大现实性要高 。 然后单击生成并耐心 - 乌龟 可以在每段短片30 秒到 几分钟之间, 特别是在高预设时 。

  5. 5

    下载或使用 API

    当生成完成时, 下载您的音频为 MP3 、 WAV 或 OGG, 或者从历史中获取它 。 要自动配置 Tomtoise 任务, 请拨打 TextToSpeechAI API 并传递您所选择的质量预设 - 记住允许较长的超时, 因为 Tortoise 缓慢地变慢 。

乌龟 TTTS API API API AIP AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIP AL ALIPI

以TextToSpeechAIREST API 生成有计划的语言。

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "乌龟需要时间,但结果值得等待。",
    "voice": "tortoise-angie"
  }'

常问问题

托托伊斯 TTS 是詹姆斯·贝克(James Betker)创建的自动递减文本到语音模式, 其优先关注音质, 并且将基于变压器的语言模型与扩散解码结合起来, 生成语言, 且具有不匹配的自然性、 情感深度和人性化的亲身行为。 它被广泛视为最现实的开放源 TTS 引擎之一。

是的,乌龟 TTS是开放源码,根据允许的阿帕奇2.0许可证,允许商业使用、修改和再分配。 在TextToSpeechAI时,乌龟由于计算要求高和产出质量异常,以每1000个字符50个信用额的高度在超端层中坐落。

乌龟的设计速度缓慢:它自动生成几个候选剪辑,然后用扩散模型和CLVP的重新排行来改进最佳剪辑。 质量第一管道意味着一个单剪辑可以从30秒到几分钟, 取决于文字长度和质量预设。 权衡的取舍是乌龟制作了任何 TTS 引擎最自然的演讲。

乌龟提供了四种预设,即以贸易速度实现质量质量交易速度:超快(~10x速度快,测试良好)、快(~4x速度快,生产默认)、标准(平衡)和高质量(最高质量,最慢)。更高预设的样本选择更多候选人,并在选择最佳结果之前运行更多的推广步骤。在TextToSpeechAI上,您可以在生成前选择预设 。

是的,乌龟 TTS 支持声音克隆,并特别忠实地支持。 提供目标声音的短短参考短片( 理想是3-10个样本,每个样本5-10秒), 乌龟捕捉了发言者的音调、 口音、 节奏和微妙的微表达。 它是最精确的零弹克隆引擎之一, 尽管克隆增加了已经一代人的寿命。

乌龟主要接受英语语言数据集的培训,因此英语的质量最强。 对于需要类似现实主义的多语言项目,请考虑TextToSpeechAI语中的F5-TTS或CosyVoice2,它们支持更多语言,同时提供语音克隆。

乌龟产生了不同寻常的、常常无法区分的与人类的音频。 它捕捉了呼吸、犹豫、民族以及轻量级模型错过的真正情感共鸣。 这就是为什么它仍然是高级音频书籍、电影叙事和高端语音作品中最受欢迎的原因,而现实主义是其中最重要的。

乌龟通常需要12-24GB VRAM, 取决于质量预设和批量大小, 因此推荐本地使用高端的 RTX 3090、 4090 或 A100 等 GPU 。 CPU 推论在技术上是可能的, 但速度极慢 。 在TextToSpeechAI 时, 模型运行在我们的 GPU 基础设施上, 所以您不需要任何硬件 。

土生土长的乌龟将24kHz WAV 制成高质量的音频。 通过 TextToSpeechAI, 您可以请求 MP3, WAV, 或 OGG, 我们用质量保护编码进行转换, 这样您就可以保持模型的详细细节, 以您项目所需的任何格式 。

乌龟在超大定价层次上是每1000个字符50个信用额度,反映了GPU的质量第一管道消耗的时间。 新账户获得免费启动信用额度,这样您可以在承诺前测试乌龟。 超大层还包括StyleTTS2、 OpenVoice、Dia和Zonos。

两者都是超层引擎,但贸易却不同。 乌龟 TTS 达到了自然和情感深度的绝对峰值,但速度最慢。 StyleTTS2 提供近乌龟质量,其生成速度要快得多,在需要许多剪辑或更快的转弯时,它更适合选择。 当质量不可谈判,时间不是限制时,选择乌龟。

是的。 注册TextToSpeechAI 获得免费启动信用,或者在主页上使用演示,并选择乌龟声音来生成一个不安装任何设备的剪辑。 因为乌龟动作缓慢, 开始使用短句和“ 快”预设来检查质量, 然后再运行更长的工作 。

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try 乌龟 TTTS Now

Generate your first audio free. No credit card required.

Start Free