Dia
UltraDialógovo orientovaný TTS s klonovaním hlasu a neverbálnymi zvukmi
O nás Dia
ing the most accurate text-to-speech results for the most complex texts. Dia is a 1.6B parameter text-to-speech model that is designed to generate natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. It excels at generating the most accurate text-to-speech results for the most complex texts. Dia is a 1.6B parameter text-to-speech model that
Kľúčové vlastnosti produktu
Generovanie dialógu
Generujte prirodzené konverzácie s viacerými reproduktormi s odlišnými hlasmi a striedaním.
Nonverbálne zvuky
Pridajte [smiech], [vzdych], [kašeľ], (dych) pre prirodzený paralingvistický výraz.
Klonovanie hlasu
Klonovať akýkoľvek hlas z 5-10 sekúnd referenčného zvuku pre personalizované reči.
Prirodzená konverzácia
Parametre 1.6B produkujú vysoko prirodzené konverzačné prosódie a intonácie.
Prípady použitia
Ako používať Dia
-
1
Zaregistrujte sa zdarma alebo otvorte demo
Vytvorte si bezplatný TextToSpeechAI účet a získajte svoje kredity, alebo si otvorte demo verziu bez registrácie a vyskúšajte Dia dialóg hneď.
-
2
Vyberte motor Dia
Dia je dialógovo orientovaný, ultra-tier model s podporou viacerých reproduktorov a klonovania hlasu, ktorý je schopný prenášať až 100000 znakov za sekundu.
-
3
Napíšte dialógový skript so značkami
Vytvorte si konverzáciu pomocou tlačidiel [S1] a [S2] na označenie každého ťahu rečníka a vložte neverbálne značky ako [smiech], [vzdych], [kašeľ] alebo (dych), kde chcete prirodzené reakcie.
-
4
Generovanie zvuku
Kliknutím na generovať odošlete svoj Dia skript na naše hostované GPU.Dia vykreslí dialóg dvoch reproduktorov s ťahom a vaše neverbálne značky do jedného zvukového súboru.
-
5
Stiahnite si alebo zavolajte API
Stiahnite si hotový dialóg vo zvolenom formáte, alebo ho automatizujte odoslaním rovnakého skriptu [S1]/[S2] do rozhrania API TextToSpeechAI s tokenom vášho účtu.
Dia API
Generujte reč programovo pomocou rozhrania REST API TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] Ahoj, ako sa dnes máš? [smeje sa] [S2] Mám sa skvele, ďakujem za otázku!",
"voice": "en_US-lessac-medium"
}'
Často kladené otázky
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50