Standard

具有自然质量的轻量级轻量TTTS

Very Fast 速度
Good 质量
克隆
9 语文

关于 角

Kokoro是一个超轻量级82M参数 TTS 模型,以惊人的速度发出自然声音。 它几乎实时运行,甚至连CPU上,它使它在低潜伏至关重要的应用中成为理想。 Kokoro支持多种语言并提供语音混合能力。

关键关键特征

超轻

82M参数, ~ 300MB 模型大小。 以最少的资源运行在 CPU 上 。

近实时

生成语音速度比回放速度更快, 即使没有 GPU 加速 。

多语言

支持英文、法文、西班牙文、印地语、日文、中文、意大利文、葡萄牙文和韩文。

语音混合

将两个声音混合在一起 创造独特的声音组合

使用案例

实时闲闲闲和虚拟助理 实时流文本到语音 边缘部署和移动应用 高容量批量处理

如何使用 角

  1. 1

    免费签名或试试演示

    创建一个免费的 TextToSpeechAI 账户, 以获得200 个初始学分, 或者使用无签名演示即时听到 Kokoro 。 标准阶梯意味着 Kokoro 仅花费每 1000 个字符 10 个学分 。

  2. 2

    选一个小口口口音

    打开语音浏览器, 并以您的目标语言选择一个 Kokoro 声音( 支持 9 个, 从英语到日语和韩语 ) 。 您也可以使用 Kokoro 声音 混合, 将两个声音混在一起, 变成定制组合 。

  3. 3

    输入文本

    输入或粘贴您想要向编辑讲的文字。 Kokoro 使用轻度82M参数, 接近实时引擎, 能够高效地处理长通道 。

  4. 4

    调整速度并生成

    设置播放速度以适合您的使用模式, 然后单击 Generate 。 Kokoro 提供音速比实时快, 所以您的演讲几乎可以马上准备好 。

  5. 5

    下载或使用 API

    以 MP3 或 WAV 下载完成的音频, 或通过 api. texttospeechai. com 的 TextToSpeechAI REST API 自动生成, 以进行批量和实时工作量 。

角 API API API AIP AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIP AL ALIPI

以TextToSpeechAIREST API 生成有计划的语言。

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "科科罗以惊人的速度和效率 来发表自然演讲",
    "voice": "en_US-lessac-medium"
  }'

常问问题

科科罗是一个超轻量级文本到语音模型,只有8 200万个参数。 尽管面积小,它还是以近实时速度,甚至以CPU的速度,在多种语言中制作了自然声音。

是的,Kokoro完全拥有Apache 2. 0的许可,包括代码和模型重量,可以不受限制地自由用于商业应用。

Kokoro支持英语(美国和英国)、法语、西班牙语、印地语、日语、中文、意大利语、葡萄牙语和韩语。

Kokoro是最快的 TTS 模型之一。 它生成的语音速度甚至比在 CPU 上的实时回放速度更快, 这使得它更适合互动应用程序 。

科科罗不支持语音克隆,它使用具有语音混合能力的特许语音图书馆。 对于语音克隆,使用F5-TTS、聊天盒、StwinTTS2、OpenVoice或乌龟。

科科罗可以将两个声音混在一起, 创造独特的组合。 这样你就可以创造自定义的声音特征, 而不使用传统的语音克隆。

光量级模型都是快速的。 Kokoro拥有更现代化的建筑,支持语音混合,而Piper拥有更大的语音图书馆。 两者都非常适合实时应用。

Kokoroo设计在CPU上运行,需要最少的资源 -- -- 大约300MB。不需要GPU,尽管GPU加速加速得到支持,甚至更快的处理。

是的。 Kokoro的发音速度甚至比CPU的回放速度快,而且低潜伏,因此它非常适合聊天机、语音助理和现场流传。 它的82M参数大小使得记忆使用很小,因此可用于大量和边缘部署。

语音混合可以混合两个Kokoro 声音, 以创建与自定义特性的独特组合。 这不是传统的克隆声音, 无法从样本中复制某个特定的人, 但是它比固定的语音库更能给你更多种类。 您可以直接在TextToSpeechAI编辑中实验混合。

这两种语言都是快速的、方便CPU的标准级引擎,没有语音克隆。 Kokoro是最轻的( 约300MB), 支持9种语言的语音混合, 而MelotTS 则侧重于多个英语口音和实时多语种输出。 选择Kokoro 来选择最小的足迹和混合; 在需要特定口音时选择 MoloTTS 。

Kokoro是一个标准级引擎,每1000个字符要花费10个信用额度,最低的为TextToSpeechAI个。新账户获得200个免费信用额度,这样你可以不付钱就尝试Kokoro。这使得它成为产生规模高质量演讲的最符合成本效益的方法之一。

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try 角 Now

Generate your first audio free. No credit card required.

Start Free