CosyVoice2
PremiumClonazione vocale multilingue a zero colpi con supporto streaming
Informazioni CosyVoice2
CosyVoice2 è un modello di sintesi vocale di nuova generazione di FunAudioLLM (Alibaba). Offre una clonazione vocale a zero colpi naturali attraverso più lingue con capacità di streaming per applicazioni a bassa latenza. Costruito su un approccio di quantizzazione scalare finito, raggiunge un'eccellente somiglianza vocale con pochi secondi di audio di riferimento.
Caratteristiche chiave
Clonazione della voce a zero colpi
Clona qualsiasi voce da 3-10 secondi di audio di riferimento con alta fedeltà.
Multilingua
Supporta cinese, inglese, giapponese, coreano e cantonese con sintesi cross-lingue.
Supporto per lo streaming
Modalità di streaming a bassa latenza per applicazioni in tempo reale e sistemi interattivi.
Prosodia naturale
La modellazione avanzata della prosodia produce un discorso naturale-suono con l'intonazione appropriata.
Casi di utilizzo
Come usare CosyVoice2
-
1
Iscriviti e richiedi crediti gratuiti
Crea un account gratuito di TextToSpeechAI per richiedere i tuoi crediti di avviamento, o provare la demo prima. GPU o locale CosyVoice2 installazione è necessario - tutto funziona sulla nostra infrastruttura.
-
2
Selezionare CosyVoice2 e aggiungere un clip di riferimento
Scegli CosyVoice2 come motore, quindi carica una registrazione di riferimento pulita di 3-10 secondi della voce che vuoi clonare. CosyVoice2 estrarrà le caratteristiche dell'altoparlante per la clonazione multilingue a zero colpi.
-
3
Inserisci il tuo testo in qualsiasi lingua supportata
Digitare o incollare il vostro script in cinese, inglese, giapponese, coreano o cantonese. CosyVoice2 supporta la sintesi cross-lingue, in modo che la voce clonata possa parlare una lingua diversa dal clip di riferimento.
-
4
Genera il discorso
Cliccare su generare e CosyVoice2 sintetizza il linguaggio naturale e multilingue nella voce clonata, solitamente in pochi secondi per un breve testo. L'utilizzo Premium tier costa 25 crediti per 1.000 caratteri.
-
5
Scarica o utilizza l'API
Scarica l'audio finito come MP3 o WAV dalla tua storia, o automatizza la clonazione vocale CosyVoice2 in scala attraverso le TextToSpeechAI API REST.
CosyVoice2 API
Generare la parola programmaticamente usando l'API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2 offre un linguaggio multilingue naturale con capacità di clonazione vocale a zero colpi.",
"voice": "en_US-lessac-medium"
}'
Domande frequenti
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25