CosyVoice2country name
PremiumMeertalige stemklonen zonder shot met ondersteuning voor streaming
Info CosyVoice2country name
CosyVoice2 is een nieuwe generatie spraaksynthese model van FunAudioLLM (Alibaba). Het levert natuurlijk klinkende zero-shot stem klonen in meerdere talen met streaming mogelijkheid voor lage-latentie toepassingen. Gebouwd op een eindige scalaire quantization aanpak, het bereikt uitstekende stem overeenkomst met slechts een paar seconden referentie audio.
Belangrijkste kenmerken
Zero-shot Voice Cloning
Kloon elke stem van 3-10 seconden referentie audio met hoge trouw.
Meertalig
Ondersteunt Chinees, Engels, Japans, Koreaans en Kantonees met een meertalige synthese.
Streaming Support
Low-latency streaming mode voor real-time toepassingen en interactieve systemen.
Natuurlijke Prosody
Geavanceerde prosody modeling produceert natuurlijk klinkende spraak met passende intonatie.
Gebruik kasten
Hoe gebruikt u dit middel? CosyVoice2country name
-
1
Aanmelden en gratis credits aanvragen
Maak een gratis TextToSpeechAI account aan om je starter credits op te eisen, of probeer eerst de demo. Er is geen GPU of lokale CosyVoice2 installatie nodig - alles draait op onze infrastructuur.
-
2
Selecteer CosyVoice2 en voeg een referentieclip toe
Kies CosyVoice2 als motor, upload dan een schone 3-10 seconde referentie opname van de stem die u wilt klonen. CosyVoice2 zal de speaker kenmerken voor nul-shot meertalig klonen extraheren.
-
3
Voer uw tekst in elke ondersteunde taal
Typ of plak je script in het Chinees, Engels, Japans, Koreaans of Kantonees. CosyVoice2 ondersteunt de cross-lingual synthese, zodat de gekloonde stem een andere taal kan spreken dan de referentie clip.
-
4
De spraak genereren
Klik op genereren en CosyVoice2 synthesiseert natuurlijke, meertalige spraak in de gekloonde stem, meestal binnen enkele seconden voor korte tekst. Premium-tier gebruik kost 25 credits per 1.000 tekens.
-
5
Download of gebruik de API
Download het voltooide geluid als MP3 of WAV uit uw geschiedenis, of automatiseer CosyVoice2 stemklonen op schaal via de TextToSpeechAI REST API.
CosyVoice2country name API
Genereer spraakprogrammamatisch met behulp van de TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 levert natuurlijke meertalige spraak met een nul\u002Dshot stemklonen vermogen.",
"voice": "en_US-lessac-medium"
}'
Veelgestelde vragen
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25