Diabetes
UltraDialogorienterad TTS med röstkloning och icke-verbala ljud
Om jag inte kan Diabetes
Dia by Nari Labs är en 1,6B parameter dialog-fokuserad text-till-tal modell. Den utmärker sig på att generera naturligt konversationstal med stöd för ickeverbala ljud som skratt, suckar, och hosta. Dia stöder flertalsdialog generation och röst kloning från 5-10 sekunder av referensljud, vilket gör det idealiskt för att skapa realistiska samtal och karaktärsröster.
Viktiga egenskaper
Dialoggenerering
Skapa naturliga flertalssamtal med tydliga röster och turn-taking.
Icke-verbala ljud
Lägg till [skrattar], [suckar], (gasps) för naturliga paralinguistiska uttryck.
Röstklappning
Clone någon röst från 5-10 sekunder av referensljud för personligt tal.
Naturligt samtal
1.6B parametrar producerar mycket naturliga konversation prosody och intonation.
Användningsfall
Hur du använder Diabetes
-
1
Registrera dig gratis eller öppna demo
Skapa ett gratis TextToSpeechAI konto för att kräva dina startpoäng, eller öppna demo utan registreringskod för att försöka Dia dialog direkt.
-
2
Välj Dia- motor
I TTS-panelen väljer Dia från motorlistan. Dia är dialogorienterad, ultra-tier-modell med multi-högtalare och röst-kloning stöd.
-
3
Skriv ett dialogskript med taggar
Komponera ditt samtal med [S1] och [S2] för att markera varje högtalare sväng, och släpp in ickeverbal taggar som [skrattar], [suckar], [suckar], eller (gasper) där du vill ha naturliga reaktioner.
-
4
Skapa ljudet
Klicka på generera för att skicka ditt Dia-skript till våra värd GPU:er. Dia återger två-talare dialog med turn-taking och dina icke-verbal taggar till en enda ljudfil.
-
5
Ladda ner eller ring API:et
Ladda ner den färdiga dialogen i ditt valda format, eller automatisera den genom att posta samma [S1] / [S2] skript till TextToSpeechAI API med ditt konto token.
Diabetes API: er
Skapa talprogrammatiskt med TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Jag mår bra, tack för att du frågar!",
"voice": "en_US-lessac-medium"
}'
Vanliga frågor
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50