Przytulny głosowy2
PremiumWielokjęzyczne klonowanie głosu zerowo-języcznym wsparciem strumieniowym
O tematie Przytulny głosowy2
CosyVoice2 jest modelem syntezy mowy następnej generacji z FunAudioLLM (Alibaba). Zapewnia naturalnie dźwięku zero klonowanie głosu w wielu językach z możliwością strumieniową do aplikacji niskookresowych. Zbudowany na skończonym podejściu skalarnej kwantyzacji, osiąga doskonałą podobność głosu z zaledwie kilka sekund odnośnego audio.
Kluczowe cechy
Klonowanie głosu zerowego
Klonuj głos z 3-10 sekund dźwięku referencyjnego z wysoką wiernością.
Wielojęzyczny
Podtrzymuje chiński, angielski, japoński, koreański i kantonski syntezą krzyżową.
Uruchomienie wsparcia
Tryb strumieniowego niskiego czasu dla aplikacji w czasie rzeczywistym i systemów interaktywnych.
Naturalna prozody
Zaawansowane modelowanie prozody wytwarza naturalnie dźwiękowe mowy z odpowiednim intonacją.
Przypadki użytkowania
Jak stosować lek Przytulny głosowy2
-
1
Zapisz się i żądaj bezpłatnych kredytów
Stwórz bezpłatne TextToSpeechAI konto, aby uzyskać swoje kredyty starterowe, lub spróbować demo najpierw. Nie jest potrzebny GPU lub lokalny instalacja CosyVoice2 - wszystko działa na naszej infrastrukturze.
-
2
Wybierz CosyVoice2 i dodaj klip referencyjny
Wybierz CosyVoice2 jako silnik, następnie prześlij czyste 3-10 sekundowe nagranie głosu, który chcesz klonować. CosyVoice2 wyciągnie cechy głośnika dla zerowego wielojęzycznego klonowania.
-
3
Wpisz swój tekst w dowolnym języku obsługiwanym
Wpisz lub wklej skrypt w chiński, angielski, japoński, koreański lub kantoński. CosyVoice2 obsługuje syntezę krzyżową, tak aby sklonowany głos mógł mówić językiem innym niż klip referencyjny.
-
4
Generuj mowy
Kliknij generować i CosyVoice2 syntetyzuje naturalne, wielojęzyczne wypowiedzi w sklonowanym głosie, zwykle w ciągu kilku sekund na krótki tekst. Premium-tier korzystanie kosztuje 25 kredytów na 1000 znaków.
-
5
Pobierz lub użyj API
Pobierz zakończony dźwięk jako MP3 lub WAV z historii lub automatycznie klonowanie głosu CosyVoice2 na skali przez TextToSpeechAI REST API.
Przytulny głosowy2 API
Generuj mowy w programie, używając TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 dostarcza naturalne wielojęzyczne przemówienie o zerowo poświęconej zdolności klonowania głosu.",
"voice": "en_US-lessac-medium"
}'
Często zadawane pytania
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25