Pocket TTS
StandardUltra-lahko kloniranje glasu, ki deluje v realnem času na CPU
O projektu Pocket TTS
Pocket TTS by Kyutai je ultra-lahek parametr 100M model, ki teče v realnem času na CPU. Kljub majhni velikosti, podpira kloniranje glasu iz samo 5 sekund referenčnega zvoka. Popoln za napotitev roba, mobilne aplikacije in scenarije, kjer so viri GPU omejeni. Trenutno podpira angleško in francosko.
Ključne lastnosti
Ultra- lahka
100M parametrov - teče v realnem času na CPU z minimalnimi viri.
Kloniranje glasu
Kloniraj glas iz samo 5 sekund referenčnega zvoka, tudi pri CPU.
Realno- čas pri CPU
GPU ni potreben.
Pripravljeni na rob
Dovolj majhna za mobilne naprave, Maline Pi, in vgrajeni sistemi.
Uporabne primere
Kako uporabljati Pocket TTS
-
1
Vpišite se brezplačno ali poskusite demo
Ustvarite brezplačno TextToSpeechAI račun za prejemanje zagonskih kreditov ali uporabite demo na mestu, da slišite Pocket TTS pred prijavo. Ni potreben GPU ali lokalna namestitev.
-
2
Izberite Pocket TTS in dodajte glas klonu
Izberite Pocket TTS kot motor, nato pa naložite kratek referenčni posnetek od približno 5 do 10 sekund, da klonira ta glas. Pocket TTS deluje v celoti na CPU, tako da je kloniranje hitro in lahka.
-
3
Vnesite svoje besedilo
Vpišite ali prilepite angleško ali francosko besedilo, ki ga želite govoriti. Pazite na število znakov, saj Pocket TTS računi po standardni stopnji 10 kreditov na 1.000 znakov.
-
4
Ustvari zvok
Kliknite generirati in Pocket TTS sintetizirajo vaše besedilo v kloniranem glasu z realno-časovno hitrostjo. Večina klipov je pripravljena v sekundah, ker je model tako majhen in CPU učinkovit.
-
5
Prenesi ali uporabi API
Prenesi končno zvočno generacijo ali avtomatsko generacijo skozi TextToSpeechAI REST API na api.texttospeechai.com z žetonom vašega računa. API razkriva isto Pocket TTS kloniranje in sintezo za vaše aplikacije.
Pocket TTS API
Ustvarite govor programsko z uporabo TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Pocket TTS zagotavlja kloniranje glasu, ki teče v realnem času, tudi pri CPU.",
"voice": "en_US-lessac-medium"
}'
Pogosta vprašanja
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10