Pocket TTS
StandardUltra-lekkie klonowanie głosu, które działa w czasie rzeczywistym w CPU
O tematie Pocket TTS
Pocket TTS przez Kyutai to ultra-latkie parametry 100M, które działa w czasie rzeczywistym w CPU. Mimo jego małej wielkości, wspiera klonowanie głosu z zaledwie 5 sekund odnośnego audio. Idealny do rozmieszczenia krawędzi, aplikacji mobilnych i scenariuszy, w których zasoby GPU są ograniczone. Obecnie obsługuje angielski i francuski.
Kluczowe cechy
Ultra- lekkie
Parametry 100M - uruchamia w czasie rzeczywistym w CPU z minimalnymi zasobami.
Klonowanie głosu
Klonuj głos z zaledwie 5 sekund odnośnego dźwięku, nawet w procesorze.
Realizacja czasu w CPU
Nie wymaga się GPU. Generuje mowy przy prędkości rzeczywistej na standardowym sprzętie.
Przygotowanie do krawędzi
Wystarczająco mały dla urządzeń mobilnych, Malina Pi i wbudowanych systemów.
Przypadki użytkowania
Jak stosować lek Pocket TTS
-
1
Zarejestruj się za darmo lub spróbuj demo
Stwórz bezpłatne konto TextToSpeechAI, aby otrzymywać kredyty starterowe, lub użyć demo na miejscu, aby usłyszeć Pocket TTS przed zalogowaniem. Nie jest potrzebny GPU ani lokalny instalator.
-
2
Wybierz Pocket TTS i dodaj głos do klonowania
Wybierz Pocket TTS jako silnik, następnie wyślij krótki klip referencyjny o około 5 do 10 sekund, aby sklonować ten głos. Pocket TTS działa w całości na procesorze, więc klonowanie jest szybkie i lekkie.
-
3
Wpisz tekst
Wpisz lub wklej tekst angielski lub francuski, który chcesz wypowiedzieć. Miej na oku liczbę znaków, ponieważ Pocket TTS banknoty standardowe stawki 10 kredytów na 1000 znaków.
-
4
Wygeneruj dźwięk
Kliknij generować i Pocket TTS syntetyzuje Twój tekst w sklonowanym głosie przy prędkości w czasie rzeczywistym. Większość klipów jest gotowa w sekundach, ponieważ model jest tak mały i wydajny na procesorze.
-
5
Pobierz lub użyj API
Pobierz zakończone pokolenie audio lub automatyzuj generację przez TextToSpeechAI REST API na api.texttospeechai.com za pomocą żetonu konta. API ujawnia to samo Klonowanie i syntezę pocketu TTS dla własnych aplikacji.
Pocket TTS API
Generuj mowy w programie, używając TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Pocket TTS dostarcza klonowanie głosu, które działa w czasie rzeczywistym, nawet w CPU.",
"voice": "en_US-lessac-medium"
}'
Często zadawane pytania
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Supported
- Languages 2
- GPU VRAM CPU OK
- Credits/1000 chars 10