Dia
UltraTTS orientato al dialogo con clonazione vocale e suoni non verbali
Informazioni Dia
Dia by Nari Labs è un modello di dialogo testuale con parametri 1.6B. Eccelle nel generare un discorso di conversazione naturale con il supporto di suoni non verbali come risate, sospiri e tosse. Dia supporta la generazione di dialogo multi-altoparlanti e la clonazione vocale da 5-10 secondi di audio di riferimento, rendendolo ideale per creare conversazioni realistiche e voci di carattere.
Caratteristiche chiave
Generazione del dialogo
Generare conversazioni multi-altoparlanti naturali con voci distinte e turn-taking.
Suoni non verbali
Aggiungi [ride], [sospira], [tosse], (sbrina) per l'espressione paralinguistica naturale.
Clonazione vocale
Clona qualsiasi voce da 5-10 secondi di audio di riferimento per il discorso personalizzato.
Conversazione naturale
1.6B parametri producono prosodia e intonazione conversazioni altamente naturale.
Casi di utilizzo
Come usare Dia
-
1
Iscriviti gratis o apri la demo
Crea un account gratuito di TextToSpeechAI per richiedere i tuoi crediti di avviamento, o apri la demo senza registrazione per provare Dia dialogue subito.
-
2
Selezionare il motore Dia
Nel cruscotto TTS scegliere Dia dalla lista dei motori. Dia è il modello dialogato, ultra-tier con supporto multi-altoparlante e cloning vocale.
-
3
Scrivi uno script di dialogo con tag
Componi la conversazione usando [S1] e [S2] per contrassegnare ogni turno di altoparlante, e cala in tag non verbali come [ride], [sospira], [tosse], o (gaspe) dove si desidera reazioni naturali.
-
4
Genera l'audio
Cliccare su Genera per inviare lo script Dia alle nostre GPU ospitate. Dia rende il dialogo a due altoparlanti con tag turn-tag e non verbali in un singolo file audio.
-
5
Scarica o chiama l'API
Scarica il dialogo finito nel formato scelto, o automatizzalo pubblicando lo stesso script [S1]/[S2] all'API TextToSpeechAI con il token del tuo account.
Dia API
Generare la parola programmaticamente usando l'API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] Ciao! Come stai oggi? [ride] [S2] Sto andando alla grande, grazie per avermelo chiesto!",
"voice": "en_US-lessac-medium"
}'
Domande frequenti
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50