CosyVoice2 Ordförande
PremiumNoll-shot flerspråkig röst kloning med streaming stöd
Om jag inte kan CosyVoice2 Ordförande
CosyVoice2 är en nästa generations talsyntesmodell från FunAudiollam (Alibaba). Den levererar naturlig noll-shot röst kloning över flera språk med streaming kapacitet för låg-latent program. Byggd på en ändlig skalar kvantisering metod, det uppnår utmärkt röst likhet med bara några sekunder av referensljud.
Viktiga egenskaper
Noll-het röstknäppning
Klon alla röst från 3-10 sekunder av referensljud med hög trohet.
Flerspråkig
Stöder kinesisk, engelsk, japansk, koreansk och kantonesiska med tvärspråkig syntes.
Strömma stöd
Strömmingläge med låg latens för realtidsapplikationer och interaktiva system.
Naturligt förfall
Avancerad prosody-modellering producerar naturligt ljudande tal med lämplig intonation.
Användningsfall
Hur du använder CosyVoice2 Ordförande
-
1
Registrera dig och begära gratis krediter
Skapa ett gratis TextToSpeechAI-konto för att kräva dina startpoäng, eller prova demo först. Ingen GPU eller lokal CosyVoice2 installation behövs - allt körs på vår infrastruktur.
-
2
Välj CosyVoice2 och lägg till ett referensklipp
Välj CosyVoice2 som din motor, ladda sedan upp en ren 3-10 sekund referensinspelning av rösten du vill klona. CosyVoice2 kommer att extrahera högtalarens egenskaper för noll-shot flerspråkig kloning.
-
3
Ange din text på något språk som stöds
Skriv eller klistra in ditt manus på kinesiska, engelska, japanska, koreanska eller kantonesiska. CosyVoice2 stöder tvärspråkig syntes, så att den klonade rösten kan tala ett språk som skiljer sig från referensklippet.
-
4
Skapa talet
Klicka på generera och CosyVoice2 syntetiserar naturligt, flerspråkigt tal i klonad röst, vanligtvis inom några sekunder för kort text. Premium-tier användning kostar 25 krediter per 1000 tecken.
-
5
Ladda ner eller använd API:et
Ladda ner det färdiga ljudet som MP3 eller WAV från din historik, eller automatisera CosyVoice2 röst kloning på skala genom TextToSpeechAI REST API.
CosyVoice2 Ordförande API: er
Skapa talprogrammatiskt med TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 levererar naturligt flerspråkigt tal med noll\u002Dshot röst kloning förmåga.",
"voice": "en_US-lessac-medium"
}'
Vanliga frågor
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25