CosyVoice2cosyName
PremiumNul-shot flersproget stemme kloning med streaming støtte
Om CosyVoice2cosyName
CosyVoice2 er en næste generation talesyntese model fra FunAudioLLM (Alibaba). Det leverer naturlig-klingende nul-shot stemme kloning på tværs af flere sprog med streaming kapacitet til lav latenstid applikationer. Bygget på en finite scalar kvantisering tilgang, det opnår fremragende stemme lighed med blot et par sekunders reference audio.
Nøglefunktioner
Zero-Shot Voice Cloning
Klon enhver stemme fra 3-10 sekunders reference audio med høj troskab.
Flersproget
Understøtter kinesisk, engelsk, japansk, koreansk og kantonesisk med tværsproget syntese.
Streaming- understøttelse
Low-latency streaming mode til real-time applikationer og interaktive systemer.
Naturlig prosody
Avanceret prosody modellering producerer naturlig-klingende tale med passende intonation.
Brugstilfælde
Hvordan man bruger CosyVoice2cosyName
-
1
Tilmeld dig og kræve gratis kreditter
Opret en gratis TextToSpeechAI konto til at gøre krav på dine startkreditter, eller prøv demoen først. Ingen GPU eller lokal CosyVoice2 installation er nødvendig - alt kører på vores infrastruktur.
-
2
Vælg CosyVoice2 og tilføje et referenceklip
Vælg CosyVoice2 som din motor, derefter uploade en ren 3-10 anden reference optagelse af den stemme, du ønsker at klone. CosyVoice2 vil udtrække højttaler egenskaber for nul-shot flersproget kloning.
-
3
Indtast din tekst på ethvert understøttet sprog
Indtast eller indsæt dit script i kinesisk, engelsk, japansk, koreansk eller kantonesisk. CosyVoice2 understøtter tværsproget syntese, så klonet stemme kan tale et andet sprog end referenceclipset.
-
4
Generér talen
Klik på generere og CosyVoice2 syntetiserer naturlig, flersproget tale i klonet stemme, normalt inden for få sekunder for kort tekst. Premium-tier brug koster 25 kreditter pr 1.000 tegn.
-
5
Download eller brug API'en
Download den færdige lyd som MP3 eller WAV fra din historie, eller automatiser CosyVoice2 stemme kloning på skala gennem TextToSpeechAI REST API.
CosyVoice2cosyName API
Generer tale programmatisk ved hjælp af TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 leverer naturlig flersproget tale med nul\u002Dshot stemme kloning kapacitet.",
"voice": "en_US-lessac-medium"
}'
Ofte stillede spørgsmål
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25