Kapesní TTS
StandardUltra-lehké klonování hlasu, které běží v reálném čase na CPU
O aplikaci Kapesní TTS
Kapesní TTS od Kyutai je ultra-lehký 100M parametr text-to-speech model, který běží v reálném čase na CPU. I přes svou malou velikost podporuje klonování hlasu z pouhých 5 sekund referenčního zvuku. Ideální pro nasazení hran, mobilní aplikace, a scénáře, kde jsou zdroje GPU omezené. V současné době podporuje anglicky a francouzsky.
Klíčové funkce
Ultralehká hmotnost
100M parametry - běží v reálném čase na procesoru s minimálními zdroji.
Klonování hlasu
Klonovat jakýkoliv hlas z pouhých 5 sekund referenčního zvuku, dokonce i na CPU.
Skutečný čas na procesoru
Není potřeba GPU. Generuje řeč v reálném čase rychlost na standardní hardware.
Edge-Ready
Dost malé pro mobilní zařízení, Malina Pi, a vložené systémy.
Pouzdra na použití
Jak se používá Kapesní TTS
-
1
Zaregistrujte se zdarma nebo vyzkoušejte demo
Vytvořte si zdarma TextToSpeechAI účet pro příjem starter kreditů, nebo použijte demo on-site slyšet Pocket TTS před přihlášením. Není zapotřebí GPU nebo místní instalaci.
-
2
Vyberte kapsu TTS a přidejte hlas do klonu
Vyberte Pocket TTS jako svůj motor, pak nahrát krátký referenční klip asi 5 až 10 sekund klonovat tento hlas. Kapesní TTS běží zcela na procesoru, takže klonování je rychlé a lehké.
-
3
Zadejte svůj text
Zadejte nebo vložte anglický nebo francouzský text, který chcete mluvit. Dávejte pozor na počet znaků, protože Pocket TTS bankovky se standardní sazbou 10 kreditů na 1000 znaků.
-
4
Generovat zvuk
Klikněte na tlačítko generovat a Pocket TTS syntetizuje váš text v klonovaném hlase rychlostí v reálném čase. Většina klipů je připravena v sekundách, protože model je tak malý a CPU efektivní.
-
5
Stáhnout nebo použít API
Stáhněte si hotový zvuk, nebo automatizujte generování přes TextToSpeechAI REST API na api.texttospeechai.com pomocí vašeho účtu token. API odhaluje stejné Pocket TTS klonování a syntéza pro své vlastní aplikace.
Kapesní TTS API
Generovat řeč programově pomocí TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Kapesní TTS přináší hlasové klonování, které běží v reálném čase, dokonce i na CPU.",
"voice": "en_US-lessac-medium"
}'
Často kladené otázky
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10