Very Fast
速度
Good
质量
无
克隆
20
语文
关于 管 TTTTS 管 TTTS
管道是一种快速的当地神经文本对语音系统,为Raspberry Pi和其他边缘设备优化。它使用基于VITS的模型,这些模型已经接受了高质量语音录音培训,在最低计算要求下提供自然声音。 管道对于需要实时语音合成但无云依赖的应用来说是完美的。
关键关键特征
超速综合综合报告
即使在像Raspberry Pi这样的低功率设备上,
CPU 优化 CPU
运行高效的CPU, 不需要昂贵的 CPU 硬件 。
20+ 语言
支持20多种语言,具有当地质量的读音。
离线业务
完全脱机工作,无需上网。
隐私第一
所有处理都发生在本地 - 您的文本永远不会离开您的设备 。
开放源码
完全开放源码,由麻省理工学院颁发许可证,具有积极的社区发展。
使用案例
智能家庭家庭助理
无障碍应用
IVR 电话系统
嵌入式设备
教育软件
离线应用
管 TTTTS 管 TTTS Voices
View All 101Alan (Fast) (UK English)
EN_GBAlan (UK English)
EN_GBAlba (UK English)
EN_GBAlejandro (Spanish (Mexico))
ES_MXAmir (Persian)
FA_IRAmy (Fast) (US English)
EN_USAmy (US English)
ENAnders (Danish)
DA_DKAnna (Hungarian)
HU_HUArctic (US English)
EN_USArthur (UK English)
EN_GBArtur (Slovenian)
SL_SI如何使用 管 TTTTS 管 TTTS
-
1
注册或打开演示
创建免费的 TextToSpeechAI 账户以接收初始学分, 或者使用页面演示 立即尝试 Piper 而不签名 。
-
2
选择一个管道声音
打开语音库,然后用管道引擎过滤,然后预览目标语言和口音的声音,找到正确的声音。
-
3
输入或粘贴您的文本
键入或粘贴您想要的脚本到文本框中。 管道处理标点和较长的段落, 这样您就可以在完整段落中投放 。
-
4
调整速度并生成
设定发言速度( 大约为0. 5x 到 2. 0x) 以适合您的工程, 然后单击生成管道, 使 Piper 以秒的速度合成 CPU 上的音频 。
-
5
下载音频或调用 API
从结果面板下载MP3、WAV或OGG的剪辑,或将同一管音弹发到/V1/generate/REST终点,使其自动化。
管 TTTTS 管 TTTS API API API AIP AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIPI AIP AL ALIPI
以TextToSpeechAIREST API 生成有计划的语言。
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "欢迎来到管道, 快速和轻量级神经 文字到语音引擎。",
"voice": "en_GB-alan-low"
}'
常问问题
管道是一个快速、轻量级神经文字到语音的引擎,可以将文字转换成自然声音。它使用基于VITS的深层次学习模型,这些模型是高效CPU推理的最佳方法,这使得Piper对边缘设备、离线工具和实时应用程序的理想。你可以直接在浏览器中试试用TextToSpeechAI的Piper免费。
是的,根据麻省理工学院的许可,Piper是完全免费的开放源码,所以你可以免费使用它进行个人和商业项目。 在TextToSpeechAI时,你可以用启动分来尝试Piper免费,继续使用成本仅为每1000个字符10分。
是的,Piper是根据许可的MIT许可证(MIT)释放的,该许可证明确允许商业用途。 你可以在商业产品、视频、应用程序和服务中用Piper产生的音频载运,而无需支付使用费或增加归属。
管道手支持20多种语言,包括英语(美国、英国和其他口音 ) 、 西班牙语、法语、德语、意大利语、葡萄牙语、荷兰语、波兰语、俄语等。 每种语言都有经过培训的管道手语声音,可以在TextToSpeechAI语音图书馆中选择。
管道是现有最快的TTS引擎之一,在CPU上运行舒适。 它可以实时合成语音,即使在草莓皮上也是如此,因此在TextToSpeechAI个大管道请求在不到一秒钟内返回音频。
不,Piper不支持语音克隆,它只使用其预先训练过的语音模型。如果你需要克隆样本中的具体声音,请使用F5-TTS或聊天盒等克隆引擎,在TextToSpeechAI上使用。
管道制作的清晰、优质的音频非常适合助理、IVR系统、解说和无障碍工具。 它不像低价价格模型那么高的忠诚度,但其速度与质量比率对大多数日常使用案例来说是极好的。
不需要 GPU 。 管道设计在 CPU 上运行, 仅使用几百兆字节的内存。 这就是为什么管道非常适合离线和嵌入式情景, 而在没有专用 GPU 的情况下, 不存在 。
是的,Piper是针对快速本地推断而建的,一旦其语音模型下载,便完全脱线运行,不需要互联网连接。 其小脚印和CPU专用设计使Piper成为脱线和在线设计演讲的最佳选择之一。
皮珀和科科罗都是快速、CPU友好、标准级引擎,没有语音克隆。 皮珀拥有一个非常庞大的多语言语音图书馆,且非常轻,而科科罗的声音往往更轻,因此,在需要更顺畅的默认声音时,可以选择Piper来表达声音和最小的资源,而科科罗则需要更顺畅的默认声音。
管道位于标准定价层,每1000个字符要10个信用额度 — — 最低水平为TextToSpeechAI个。 新账户获得免费启动信用额度,这样您就可以在投入前免费测试管道。
从语音库中选择一个 Piper 声音, 然后用您的 API 标记将其语音片段传送到 / v1/generate/ endpoint。 REST API 将音频转换为并返回下载的 URL, 您可以请求 MP3, WAV 或 OGG 输出 。
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 20
- GPU VRAM 500MB
- Credits/1000 chars 10