Dia
UltraDialogorientiertes TTS mit Stimme klonen und nonverbalen Klängen
Über Dia
Dia von Nari Labs ist ein 1,6B-Parameter dialogorientiertes Text-zu-Speech-Modell. Es zeichnet sich durch natürliche Konversationssprache mit Unterstützung für nonverbale Klänge wie Lachen, Seufzen und Husten aus. Dia unterstützt Multi-Speaker Dialog Erzeugung und Stimme Klonen von 5-10 Sekunden Referenz-Audio, so dass es ideal für realistische Gespräche und Charakter Stimmen erstellen.
Hauptmerkmale
Dialog-Generierung
Generieren Sie natürliche Multi-Sprecher-Gespräche mit unterschiedlichen Stimmen und Turn-Take.
Nonverbale Geräusche
Fügen Sie [lacht], [seufzt], [soughs], (schnappen) für natürlichen paralinguistischen Ausdruck hinzu.
Stimme Klonen
Klonen Sie jede Stimme von 5-10 Sekunden Referenz-Audio für personalisierte Sprache.
Natürliche Gespräche
1.6B-Parameter erzeugen sehr natürliche Konversationsprosodie und Intonation.
Anwendungsfälle
Verwendung Dia
-
1
Melde dich kostenlos an oder öffne die Demo
Erstellen Sie ein kostenloses TextToSpeechAI-Konto, um Ihre Starter-Gutschriften zu beanspruchen, oder öffnen Sie die No-Signup-Demo, um Dia-Dialog sofort zu versuchen.
-
2
Wählen Sie die Dia-Engine
Im TTS-Dashboard wählen Sie Dia aus der Motorenliste. Dia ist das dialogorientierte, ultra-tier Modell mit Multi-Lautsprecher und Sprach-Klon-Unterstützung.
-
3
Schreiben eines Dialogskripts mit Tags
Komponieren Sie Ihr Gespräch mit [S1] und [S2], um jeden Lautsprecherzug zu markieren und fallen Sie in nonverbale Tags wie [lacht], [seufzt], [müde] oder (schnappen) wo Sie natürliche Reaktionen wollen.
-
4
Erzeugen des Audios
Klicken Sie auf Generieren, um Ihr Dia-Skript an unsere gehosteten GPUs zu senden. Dia rendert den Zwei-Lautsprecher-Dialog mit Turn-Take und Ihren nonverbalen Tags in eine einzige Audiodatei.
-
5
API herunterladen oder aufrufen
Laden Sie den abgeschlossenen Dialog in Ihrem gewählten Format herunter oder automatisieren Sie ihn, indem Sie das gleiche [S1]/[S2] Skript mit Ihrem Konto-Token in die TextToSpeechAI API eingeben.
Dia API
Erzeugen Sie Sprache programmatisch mit der TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] Hallo da! Wie geht es dir heute? [lacht] [S2] Ich mache es großartig, danke für die Frage!",
"voice": "en_US-lessac-medium"
}'
Häufig gestellte Fragen
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50