Very Fast
速度
Good
质量
是
克隆
2
语文
关于 袋式TTTT
京地的口乐TTS是一个超轻轻量级100M参数文本到语音模型,实时运行在CPU上。尽管其小,但它支持仅5秒钟的音频参考,支持语音克隆。适合边缘部署、移动应用和GPU资源有限的情景。目前支持英语和法语。
关键关键特征
超轻
100M参数 - 实时运行CPU, 资源极少。
语音克隆
仅仅5秒钟的音频 甚至在CPU上 也打开任何声音
CPU 实时
不需要 GPU 。 生成标准硬件实时发言 。
边缘准备
足够小的移动设备, 草莓皮和嵌入系统。
使用案例
边缘和机动部署
CPU实时语音助理
IoT 和嵌入设备
低资源语音克隆
如何使用 袋式TTTT
-
1
免费签名或试试演示
创建免费的 TextToSpeechAI 账户以接收初始学分, 或者在注册前使用现场演示来听 Pocket TTS 。 不需要 GPU 或本地安装 。
-
2
选择小口袋 TTTS 并添加一个声音到克隆
选择 Pocket TTS 做您的引擎, 然后上传一个大约5至10秒的短参考剪辑来克隆这个声音。 Pocket TTS 完全在 CPU 上运行, 所以克隆是快速和轻巧的。
-
3
输入文本
输入或粘贴您想要使用的英语或法语文本。 注意字符数, 因为 Pocket TTS 账单按每千个字符10个分数的标准费率计算 。
-
4
生成音频
点击生成并用实时速度将您的文字以克隆声音合成。 大部分剪辑都以秒数准备, 因为模型太小且CPU效率高。
-
5
下载或使用 API
使用您的账户符号下载已完成的音频或自动生成, 或通过 api. texttospeechai. com 上的 TextToSpeechAI REST API 下载完成的音频或自动生成。 API 将同样的 Pocket TTS 克隆和合成曝光到您自己的应用程序中 。
袋式TTTT API API API AIP AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIP AL ALIPI
以TextToSpeechAIREST API 生成有计划的语言。
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "口袋 TTS提供实时的语音克隆 即使在CPU上",
"voice": "en_US-lessac-medium"
}'
常问问题
口袋 TTS是来自九井的超轻量量级文本到语音模型,仅有1亿项参数,实时运行在CPU上,支持5秒钟的语音克隆。
口袋 TTS 以CC-BY-4.0获得许可,允许商业使用,并附带归属。在商业应用中,您必须将其记入九井名下。
目前,口袋 TTS支持英文和法文,今后发布时可能增加更多语言。
是的! 仅使用100米参数, 便携 TTS 以实时速度运行标准 CPU 硬件。 不需要 GPU, 这使得它适合边缘部署和移动应用 。
两者都是轻量级的, 并且都在CPU上运行良好。 Pocket TTS 独家支持语音克隆( Kokoro没有支持)。 Kokoro支持更多语言( 9 和 2 ) 。 如果您需要轻量级语音克隆, 选择 Pocket TTS 。 如果您需要更多语言覆盖, Kokoro 则选择 Kokoro 。
提供5秒钟的参考音频。 Pocket TTS 提取了发言者的特性,并能够以该声音生成新的演讲。 质量随着参考时间的延长而提高(最多10秒)。
是的。 与大多数需要通用克隆装置的克隆模式不同,Pocket TTS通过小的100米参数足迹完全在CPU上进行零光语音克隆。 你可以从短片上复制声音,即使是在笔记本电脑或单机电脑上。
口袋TS根据CC-BY-4.0发布,所以使用或重新分配时,您必须将九井作为原创创造者。 类似“由九井口板TTS产生的声音”这样的简单属性既满足商业和非商业用途的许可要求,也满足商业和非商业用途的许可要求。
口袋 TTS 实时或更快地生成标准CPU的语音,不需要 GPU 。 这使得它成为低延使用案例( 如现场语音助理和机能生成) 最能响应的引擎之一。
价格标准定价等级是每千个字符10个信用额度。 这使得它成为TextToSpeechAI个字符中最经济的语音接线选项之一。
两者都是轻量级、CPU友好型、标准级引擎。 需要语音克隆时,请选择小口特 TTS, 因为Kokoro不支持。 需要使用更宽的语言覆盖且不需要克隆特定声音时,请选择Kokoro。
是的。 新的TextToSpeechAI个账户获得免费启动信用, 现场演示可以让您在承诺前听到 Pocket TTS 。 注册免费, 上传一个短参考剪辑, 并在秒内生成克隆语言 。
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10