Dia
UltraTTS met dialooggerichte stemklonen en nonverbale geluiden
Info Dia
Dia by Nari Labs is een 1,6B parameter dialoog-gerichte tekst-tot-spraak model. Het blinkt uit in het genereren van natuurlijke conversatie toespraak met ondersteuning voor nonverbale geluiden zoals lachen, zuchten en hoesten. Dia ondersteunt multi-luidspreker dialoog generatie en stem klonen van 5-10 seconden referentie audio, waardoor het ideaal voor het creëren van realistische gesprekken en karakter stemmen.
Belangrijkste kenmerken
Dialooggeneratie
Genereer natuurlijke multi-spreker gesprekken met verschillende stemmen en draai-taking.
Nonverbale geluiden
Voeg [lacht], [zucht], [hoesten], (hapt) voor natuurlijke parale taaluitdrukking toe.
Stemklonen
Kloon elke stem van 5-10 seconden referentie audio voor persoonlijke spraak.
Natuurlijke gesprekken
1.6B parameters produceren zeer natuurlijke conversatie prosody en intonatie.
Gebruik kasten
Hoe gebruikt u dit middel? Dia
-
1
Gratis aanmelden of de demo openen
Maak een gratis TextToSpeechAI-account aan om je startercredits op te eisen, of open de no-signup demo om Dia dialoog meteen uit te proberen.
-
2
Selecteer de Dia-motor
In het TTS dashboard kiest u Dia uit de motorlijst. Dia is het dialooggerichte, ultra-tier model met multi-luidspreker en stemklonering ondersteuning.
-
3
Een dialoogscript schrijven met tags
Stel uw gesprek samen met [S1] en [S2] om elke speaker draaien te markeren, en laat in nonverbale tags zoals [lacht], [zucht], [hoesten], of (haasjes) waar je natuurlijke reacties wilt.
-
4
Het audio-bestand aanmaken
Klik op genereren om uw Dia script naar onze gehoste GPU's te sturen. Dia maakt de dialoog met twee luidsprekers met turn-taking en uw nonverbale tags in één enkel audiobestand.
-
5
Download of bel de API
Download de voltooide dialoog in uw gekozen formaat, of automatiseer het door hetzelfde [S1]/[S2] script te plaatsen naar de TextToSpeechAI API met uw account token.
Dia API
Genereer spraakprogrammamatisch met behulp van de TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Hallo daar, hoe gaat het vandaag?",
"voice": "en_US-lessac-medium"
}'
Veelgestelde vragen
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50