Kokoro
StandardBłyskawiczna, lekka TTS o naturalnej jakości
O tematie Kokoro
Kokoro jest ultra-latecznym parametrem 82M TTS modelem, który zapewnia naturalnie dźwiękową mowy z niesamowitą prędkością. Bieży w pobliżu czasu rzeczywistego nawet w CPU, co sprawia, że jest idealny dla aplikacji, w których niska latencja jest krytyczna. Kokoro obsługuje wiele języków i oferuje możliwości mieszania głosu.
Kluczowe cechy
Ultra- lekkie
82M parametry, ~300MB rozmiar modelu. Uruchamia procesor z minimalnymi zasobami.
Niedaleko czasu rzeczywistego
Generuje mowy szybciej niż szybkość odtwarzania, nawet bez przyspieszenia GPU.
Wielojęzykowy
Wsparcie angielski, francuski, hiszpański, hindi, japoński, chiński, włoski, portugalski i koreański.
Zmieszanie głosu
Mieszaj dwa głosy, aby stworzyć wyjątkowe kombinacje głosu.
Przypadki użytkowania
Jak stosować lek Kokoro
-
1
Zarejestruj się za darmo lub spróbuj demo
Stwórz bezpłatne TextToSpeechAI konto aby uzyskać 200 kredytów starterowych, lub użyć demo bez podpisu, aby usłyszeć Kokoro natychmiast. Standardowy poziom oznacza Kokoro kosztuje tylko 10 kredytów na 1000 znaków.
-
2
Wybierz głos Kokoro
Otwórz przeglądarkę głosową i wybierz głos kokoro w języku docelowym (9 obsługiwanych, z angielskiego na japoński i koreański). Możesz również użyć kokoro mączki głosowej, aby zmieszać dwa głosy w połączeniach własnych.
-
3
Wpisz tekst
Wpisz lub wklej tekst, który chcesz wymienić do edytora. Kokoro sprawnie obsługuje długie przejścia dzięki lekkim 82M-parametrom, w pobliżu silnika w czasie rzeczywistym.
-
4
Ustawia prędkość i generuje
Ustaw szybkość odtwarzania, aby dopasować do przypadku użytkowania, a następnie kliknij Generuj. Kokoro odtwarza dźwięk szybciej niż w czasie rzeczywistym, więc przemówienie jest gotowe niemal natychmiast.
-
5
Pobierz lub użyj API
Pobierz zakończony dźwięk jako MP3 lub WAV, lub automatyzuj generację przez TextToSpeechAI REST API w api.texttospechai.com dla partii i czasu rzeczywistego.
Kokoro API
Generuj mowy w programie, używając TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Kokoro dostarcza naturalne przemówienie z niesamowitą szybkością i wydajnością.",
"voice": "en_US-lessac-medium"
}'
Często zadawane pytania
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 9
- GPU VRAM CPU OK
- Credits/1000 chars 10