وہ

Ultra

گفتگو پر متمرکز TTS آواز کے کلوننگ اور غیر لفظی آوازوں کے ساتھ

Medium رفتار
Excellent معيار
ہاں کلوننگ
1 زبانیں

متعلقہ وہ

ing the voice of the speaker, and is capable of generating a 100% accurate voice. Dia is a 1.6B parameter text-to-speech model that is capable of generating natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. It excels at generating a 100% accurate voice of the speaker, and is capable of generating a 100% accurate voice of the speaker.

کلیدی خصوصیات

ڈائیلاگ پیدائش

مختلف آوازوں اور لٹ لینے کے ساتھ قدرتی کثیر اسپیکر گفتگو پیدا کریں

غير لفظي آوازیں

فطري paralinguistic اظہار کے ليے [ ہنستا هے ] ، [ سھتا هے ] ، [ سيہ ] ، ( گيسپ ) شامل کريں

آواز کا کلوننگ

شخصی کلام کے لئے 5-10 سیکنڈ سے کوئی آواز کلون کریں

فطری گفتگو

1.6B پیرامیٹرز بہت قدرتی گفتگو prosody اور انٹنیشن پیدا کرتے ہیں.

استعمال کے حالات

ڈالوگ اور بات چیت پيدا کريں متعدد حروف کے ساتھ آڈیو بک پروڈیوس کھيل کے کردار کي آوازیں پوڈکاسٹ اور مواد کی تخلیق

استعمال کيونکر کريں وہ

  1. 1

    مفت میں رجسٹر کریں یا ڈیمو کھولیں

    آپ کے شروع کريٹز کو مطالبہ کرنے کے ليے مفت TextToSpeechAI اکاؤنٹ بنايں يا ديا ڈائيلوگ کو فوري طور پر آزمانا چا هيتے هيں تو نا ساين اپ ڈیمو کھوليں

  2. 2

    Dia انجن منتخب کريں

    TTS ڈش بورڈ ميں انجن فہرست سے Dia کو منتخب کريں Dia ديالوگ پر متمرکز ، اعلي سطحي ماڈل هے جو چند اسپيکر اور آواز کي کلوننگ کو مدد ديتا هے

  3. 3

    ٹیگز کے ساتھ ڈائیلاگ سکرپٹ لکھیں

    هر اسپيکر کے دور کو نشانہ بنا نے کے ليے [S1] اور [S2] کے استعمال سے آپکے گفتگو کو بنا ئيں اور غير لفظي ٹگز کو ڈاليں مثلا [لا ئے], [سھنا], [کوشہ)، يا (گاس) جہاں آپ طبيعي ردعمل چا هيتے هيں

  4. 4

    آڈیو بناؤ

    آپ کا Dia اسکریپٹ ہمارے GPUs کو بھیجنے کے ليے جنري کريں کلک کريں Dia دو اسپيکر ڈائيلوگ کو تير ٹک نگ اور آپ کے غير لفظي ٹگ کے ساتھ ایک واحد او ڊيو فائ ل ميں رينڈر کر تا هے

  5. 5

    API کو ڈاؤن لوڈ کریں یا کال کریں

    آپ کے منتخب شدہ فارمیٹ میں مکمل گفتگو ڈائون لوڈ کریں، یا اسے خودکار کر دیں TextToSpeechAI API پر آپ کے اکاؤنٹ کے ٹوکن کے ساتھ ایک ہی [S1]/[S2] سکرپٹ کو پوسٹ کر کے.

وہ API

TextToSpeechAI REST API کے استعمال سے پروگرامنگ کے طور پر بولي پيدا کريں

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] سلام! آج آپ کیسے ہیں؟ [ ہنسی] [S2] میں اچھا کر رہا ہوں، پوچھنے کے لئے شکریہ!",
    "voice": "en_US-lessac-medium"
  }'

بار بار پوچھے گئے سوالات

Dia نا ري ليبز سے 1.6B پارا مٹر ڈائيلو گ اؤ ر ائيڈ ٹیکس-ٹو- اسپيچ ماڈل هے ۔ یہ چند اسپيکر ، غير لفظي آوازوں اور آواز کے کلوننگ کے ليے مدد کے ساتھ فطري گفتگو کي آواز کي پيدا کر نے ميں خاص هے

ہاں، Dia مکمل طور پر Apache 2.0 لائسنس ہے - کوڈ اور ماڈل وزن دونوں. یہ تجارتی ایپلیکیشنز میں آزادانہ استعمال کیا جاسکتا ہے.

حاليں Dia صرف انگريزي کو مدد ديتا هے ماڈل طبيعي انگريزي گفتگو کے ليے تحسين کريے گيا هے

Dia کو اسکے 1.6B پیرامیٹر ماڈل کے لیے VRAM کے تقریباً 10GB کی ضرورت ہے. ایک GPU کم سے کم 12GB کے ساتھ آرام دہ آپریشن کے لیے سفارش کی جاتی ہے. TextToSpeechAI پر یہ سب ہمارے مہمان GPUs پر چلتا ہے، تو آپ کو اپنے اپنے کوئی ہارڈ ویئر کی ضرورت نہیں ہے.

ہاں - ديالوگ عيناً وہي ہے جو Diaکے ليے بنا يا گيا هے آپکے اسکرپٹ ميں [S1] اور [S2] کو بدل کر DiaTTS دو اسپيکر کو گفتگو کر نے کے ليے تيار کر تا هے جو مختلف آوازوں اور حقيقي طور پر تير گي کے ليے ، جو SingleSpeakerTTS ماڈل کے ليے حاصل کر نے ميں مشکل هے

آپکے ليکے هر لائن کو [S1] يا [S2] کے ساتھ پيش کريں تا کہ کسے بول رہا هے Dia ہر ٽيڪ کي آواز کو منسلک کر تا هے اور اس کے درمیان تبديلي کر تا هے جب بات چياں چلتا هے ، اس ليے [S1] اور [S2] آپکے دائيلو گ ميں دو حروف کے طور پر کام کر تا هے

ہاں۔ Dia صاف حوالہ آ ڊيو کے تقريباً 5-10 سيکنڈ سے آواز کلوننگ کو مدد دےتا هے ، آپ کو اسپیکر کے ليے خاص آواز کو دوبار استعمال کر نے کے ليے اجازت دےتا هے ۔ آپ [S1]/[S2] ٹی گز کے ساتھ کلوننگ کو جوڑ سکتے هيں تا کہ دائيلو گ میں ہر حروف آواز کي طرح لگتا هے جو آپ نے کلون کي هيں

Dia [ ہنستے هيں] ، [سھتے هيں] ، [سر درد هے هيں] اور (گيسپ) کو فطري paralinguistic آوازوں کے طور پر بيان کر تا هے جو کہ زبان ميں دخل کريے جا ئيں اور نہيں کہ وائي لفظوں ميں ۔ آپ کو اس ردعمل کے ليے جسے آپ چا هيتے هيں ، مثال کے طور پر "[S1] یہ مضحکہ خيز هے [ ہنستے هيں]" ميں ٹيگ لگانا چا هيے ۔ اس سے گفتگو کي انساني گي محسوس کريے

دوئي Dia اور Bark غير لفظي آوازوں کو مدد ديتے هيں ، ليکن Dia کو چند اسپيکر کي گفتگو کے ليے بنا يا گيا هے [S1]/[S2] تير گي اور آواز کي کلوننگ کے ليے Dia کو منتخب کريں حقيقي دو شخصوں کے مباحثے اور کردار کا کام کے ليے Dia کو منتخب کريں Bark اس وقت بہتر ميں ميں آتا هے جب آپ کو واحد آواز کے بيان ميں زبان کے وسیع کو ليے ضرورت هے

Diaا يں 1000 حروف کي بنا ئے گ ئے کلام کے ليے 50 کر ڈٹ لگتا هے اس ليے Diaا يں 1000 حروف کي بنا ئے گ ئے کلام کے ليے 50 کر ڈٹ لگتا هے اس ليے Diaا يں 1000 حروف کي بنا ئے گ ئے کلام کے ليے 50 کر ڈٹ لگتا هے اس ليے Diaا يں 1000 حروف کي بنا ئے گ ئے کلام کے ليے 50 کر ڈٹ لگتا هے

ہاں۔ نئے TextToSpeechAI اکاؤنٹس میں مفت شروع کریڈٹ شامل ہیں اور ایک ڈیمو بھی ہے جو آپ بغیر سائن اپ کے چلا سکتے ہیں۔ ایک پیسہ دینے والے منصوبے پر فیصلہ کرنے سے پہلے [S1]/[S2] ٹیگز کے ساتھ ایک مختصر Dia ڈائیلاگ پیدا کرنے کے لئے یہ کافی ہے۔

ہاں۔ ایک بار آپ کے پاس آپ کے اکاؤنٹ کی صفحے سے ایک API ٹوکن ہو جاتا ہے تو آپ Dia ڈائیلاگ سکرپٹس کو بھیج سکتے ہیں - [S1]/[S2] کے ساتھ اور [laughs] جیسے ٹیگز - TextToSpeechAI REST API اور اس سے حاصل ہونے والی آڈیو کو پروگرامنگ کے ذریعے ڈاؤنلوڈ کر سکتے ہیں۔

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try وہ Now

Generate your first audio free. No credit card required.

Start Free