در مورد اون
ing a 100% natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from 5-10 seconds of reference audio, making it ideal for creating realistic conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from
ویژگیهای کلیدی
تولید محاورهها
تولید مکالمات طبیعی چندگوینده با صداهای متمایز و نوبتگیری.
صداهای غیر کلامی
براي تعبير طبيعي زباني، [خنده]، [تنهاشي]، [سرفه]، [تنفس] رو اضافه کنيد
شبیهسازی صدا
هر صدا را از ۵ تا ۱۰ ثانیه صدای مرجع برای گفتار شخصی کپی کنید.
گفتگوی طبیعی
پارامترهای ۱٫۶B تولید بسیار طبیعی و مکالمه ی طنازانه را تولید می کنند.
موارد استفاده
چطور استفاده شود اون
-
1
ثبت نام رایگان یا باز کردن نمایش
در این نسخه از TextToSpeechAI، امکان استفاده از رمز عبور برای ورود به سیستم وجود ندارد و تنها میتوانید با استفاده از یک کلید خصوصی وارد سیستم شوید.
-
2
برگزیدن موتور Dia
در صفحه نمایش TTS Dia را از فهرست موتور انتخاب کنید. Dia مدل فوقطبقهای با محوریت گفتگو و پشتیبانی از چند بلندگو و شبیهسازی صدا است.
-
3
نوشتن یک دستنوشتۀ محاورهای با برچسبها
گفتگوی خود را با استفاده از [S1] و [S2] برای نشان دادن هر نوبت سخنران، و برچسبهای غیرکلامی مانند [خنده]، [آهنگ]، [سرفه] یا (هواکشیدن) را در جایی که واکنشهای طبیعی را میخواهید، بگذارید.
-
4
تولید صدا
برای ارسال دستنوشتۀ Dia به GPUهای میزبان ما ، روی تولید کلیک کنید. Dia گفتگوی دو بلندگو را با نوبتگیری و برچسبهای غیرکلامی شما را به یک پروندۀ صوتی واحد تبدیل میکند.
-
5
بارگیری یا فراخوانی API
گفتگوی تمام شده را در قالب انتخابی خود دانلود کنید، یا آن را با ارسال همان اسکریپت [S1]/[S2] به API TextToSpeechAI با نشانه حساب خود خودکار کنید.
اون API
تولید گفتار به صورت برنامهریزی شده با استفاده از REST API TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "سلام امروز چطوری؟ حالم خوبه ممنونم که پرسیدی",
"voice": "en_US-lessac-medium"
}'
پرسشهای متداول
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50