وہ
Ultraگفتگو پر متمرکز TTS آواز کے کلوننگ اور غیر لفظی آوازوں کے ساتھ
متعلقہ وہ
ing the voice of the speaker, and is capable of generating a 100% accurate voice. Dia is a 1.6B parameter text-to-speech model that is capable of generating natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. It excels at generating a 100% accurate voice of the speaker, and is capable of generating a 100% accurate voice of the speaker.
کلیدی خصوصیات
ڈائیلاگ پیدائش
مختلف آوازوں اور لٹ لینے کے ساتھ قدرتی کثیر اسپیکر گفتگو پیدا کریں
غير لفظي آوازیں
فطري paralinguistic اظہار کے ليے [ ہنستا هے ] ، [ سھتا هے ] ، [ سيہ ] ، ( گيسپ ) شامل کريں
آواز کا کلوننگ
شخصی کلام کے لئے 5-10 سیکنڈ سے کوئی آواز کلون کریں
فطری گفتگو
1.6B پیرامیٹرز بہت قدرتی گفتگو prosody اور انٹنیشن پیدا کرتے ہیں.
استعمال کے حالات
استعمال کيونکر کريں وہ
-
1
مفت میں رجسٹر کریں یا ڈیمو کھولیں
آپ کے شروع کريٹز کو مطالبہ کرنے کے ليے مفت TextToSpeechAI اکاؤنٹ بنايں يا ديا ڈائيلوگ کو فوري طور پر آزمانا چا هيتے هيں تو نا ساين اپ ڈیمو کھوليں
-
2
Dia انجن منتخب کريں
TTS ڈش بورڈ ميں انجن فہرست سے Dia کو منتخب کريں Dia ديالوگ پر متمرکز ، اعلي سطحي ماڈل هے جو چند اسپيکر اور آواز کي کلوننگ کو مدد ديتا هے
-
3
ٹیگز کے ساتھ ڈائیلاگ سکرپٹ لکھیں
هر اسپيکر کے دور کو نشانہ بنا نے کے ليے [S1] اور [S2] کے استعمال سے آپکے گفتگو کو بنا ئيں اور غير لفظي ٹگز کو ڈاليں مثلا [لا ئے], [سھنا], [کوشہ)، يا (گاس) جہاں آپ طبيعي ردعمل چا هيتے هيں
-
4
آڈیو بناؤ
آپ کا Dia اسکریپٹ ہمارے GPUs کو بھیجنے کے ليے جنري کريں کلک کريں Dia دو اسپيکر ڈائيلوگ کو تير ٹک نگ اور آپ کے غير لفظي ٹگ کے ساتھ ایک واحد او ڊيو فائ ل ميں رينڈر کر تا هے
-
5
API کو ڈاؤن لوڈ کریں یا کال کریں
آپ کے منتخب شدہ فارمیٹ میں مکمل گفتگو ڈائون لوڈ کریں، یا اسے خودکار کر دیں TextToSpeechAI API پر آپ کے اکاؤنٹ کے ٹوکن کے ساتھ ایک ہی [S1]/[S2] سکرپٹ کو پوسٹ کر کے.
وہ API
TextToSpeechAI REST API کے استعمال سے پروگرامنگ کے طور پر بولي پيدا کريں
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] سلام! آج آپ کیسے ہیں؟ [ ہنسی] [S2] میں اچھا کر رہا ہوں، پوچھنے کے لئے شکریہ!",
"voice": "en_US-lessac-medium"
}'
بار بار پوچھے گئے سوالات
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50