GPT-سو ویٹس

Premium

کم-شٹ آواز کلوننگ اعلیٰ معیار کے خروجی کے ساتھ

Medium رفتار
Excellent معيار
ہاں کلوننگ
5 زبانیں

متعلقہ GPT-سو ویٹس

-quality speech clones.

کلیدی خصوصیات

چند شٹ آواز کلوننگ

بہترین کیفیت کے لئے ایک نقل کے ساتھ 3-10 سیکنڈ سے کوئی آواز کلون کریں.

کرس لينگويج سينتھز

چيني، انگريزي، جاپاني، کو ري يا يا کانٹو ني زبان ميں ایک زبان پر تربيت کريں اور بولي بنايں

اعلیٰ معیار

جی پی ٹی-سوویتس مسلسل موجود سب سے اعلیٰ معیار آواز کلوننگ ماڈل میں سے ایک ہے.

اوپن سورس

مکمل طور پر MIT فعال کمیونٹی ترقی اور وسیع دستاویزات کے ساتھ لائسنس.

استعمال کے حالات

پرو فاشل آواز کلوننگ کراس زباني دو بلينگ اور مقامي آڈیو بک پیداوار حرفي آواز

استعمال کيونکر کريں GPT-سو ویٹس

  1. 1

    مفت اکاؤنٹ بناؤ يا ڈیمو کھولو

    مفت شروع کریڈٹ حاصل کرنے کے لئے TextToSpeechAI کے لئے رجسٹر کریں، یا GPT-SoVITS کو آزمانے کے لئے ڈیمو میں سیدھا جھٹکا دیں بغیر کسی بھی رجسٹریشن کی ضرورت کے.

  2. 2

    GPT-SoVITS منتخب کريں اور ريفرنس کلپ اپ لوڈ کريں

    آپ کا انجن GPT-SoVITS منتخب کريں، پھر آپ کو 3-10 ثانيه کا اشارے کلپ آپ کو کلون کرنا چا هيے اس کلپ کے نقل کو شامل کريں صاف ترین، سب سے صحيح کلون ملتا هے

  3. 3

    آپ کا متن داخل کریں

    متن ٹائپ کریں يا چپکا دیں جو آپ کلون کی آواز میں بولنا چا هيتے هيں GPT-SoVITS چيني، انگريزي، جاپاني، کو رياني اور کانٹو ني کو مدد ديتا هے، اس ميں کراس لنگويج کلوننگ شامل هے جو دوسرے زبان کے حوالے سے هے

  4. 4

    آڈیو بناؤ

    ہمارے GPU سرور پر کام بھیجنے کے ليے جنرائز کلک کريں GPT-SoVITS متوسط رفتار پر ممتاز معيار کلونڈ کلام رينڈر کر تا هے ، 25 کريڈٹس کے ساتھ هر 1000 حروف کے ليے بلنگ

  5. 5

    API ڈائون لوڈ کریں یا استعمال کریں

    آپ کا مکمل GPT-SoVITS اوڈیو فائلیں کے طور پر ڈاؤن لوڈ کریں، یا آپریشن کے عمل کے لئے api.texttospeechai.com پر TextToSpeechAI REST API کے ذریعے خودکار پیداوار.

GPT-سو ویٹس API

TextToSpeechAI REST API کے استعمال سے پروگرامنگ کے طور پر بولي پيدا کريں

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "GPT\u002DSoVITS صرف چند سیکنڈ کے آڈیو سے اعلیٰ معیار کی آواز کلوننگ پیدا کرتا ہے.",
    "voice": "en_US-lessac-medium"
  }'

بار بار پوچھے گئے سوالات

GPT-SoVITS ایک state-of-the-art آواز کلوننگ سسٹم ہے جو GPT-style زبان ماڈلنگ کو SoVITS آواز تبدیل کے ساتھ جوڑتا ہے یہ صرف 3-10 سیکنڈ کے حوالہ آڈیو سے قابل ذکر قدرتی آواز کلون بناتا ہے

جی ہاں، GPT-SoVITS مکمل طور پر MIT لائسنس ہے - کوڈ اور ماڈل وزن دونوں. یہ تجارتی ایپلیکیشنوں میں آزادانہ استعمال کی جاسکتی ہے بغیر کسی پابندی کے.

GPT-SoVITS چینی، انگریزی، جاپانی، کو ری اور کانٹونا کو مدد دیتا ہے یہ زبانوں کے درمیان آواز کی کلوننگ کو بھی مدد دیتا ہے - ایک زبان میں حوالہ فراہم کرتا ہے اور دوسری زبان میں بولتا ہے

GPT-SoVITS مسلسل اعلیٰ معیار آواز کلوننگ ماڈل کے درمیان مرتب ہے یہ زیادہ تر متبادلوں سے زیادہ قدرتی prosody پیدا کرتا ہے، خاص طور پر جب حوالہ آڈیو کے ایک نقل کے ساتھ فراہم کیا جاتا ہے.

بہترین نتائج کے لیے، دوہرا حوالہ آڈیو کلپ اور اسکے متن کے نقل کو فراہم کریں. نقل ماڈل کو حوالہ آواز کی خصوصیات کو بہتر سمجھنے میں مدد کرتا ہے. نقل کے بغیر، ماڈل اب بھی کام کرتا ہے لیکن کیفیت تھوڑا کم ہو سکتی ہے.

GPT-SoVITS کو انپٹ لمبائی پر منحصر VRAM کے 4-8GB کی ضرورت ہوتی ہے. ایک GPU 6GB یا اس سے زیادہ کے ساتھ بہترین کارکردگی کے لیے سفارش کی جاتی ہے. TextToSpeechAI پر ماڈل ہمارے GPU سرور پر چلتا ہے، تو آپ کو اپنے آپ کے کوئی ہارڈ ویئر کی ضرورت نہیں ہے۔

GPT-SoVITS موجود سب سے زیادہ واقعی آواز کلوننگ کے کچھ فراہم کرتا ہے، ایک مختصر حوالہ کلیپ سے وفادار طور پر ٹمبر، اکسن، اور پروسوڈی کو دوبارہ پیدا کرتا ہے. حوالہ آڈیو کے ایک نقل فراہم کرنے سے کیفیت بھی زیادہ بڑھتی ہے، کلونوں کو تقریباً منبع اسپیکر سے ممتاز نہیں کرتا.

GPT-SoVITS کو صرف 3-10 سیکنڈ کی ضرورت ہوتی ہے صاف حوالہ آڈیو کو آواز کو کلون کرنے کے لیے کم سے کم پس منظر کی شور کے ساتھ ایک مختصر، صاف نمونہ بہترین نتائج دیتا ہے، اور مطابقت رکھنے والی نقل کو شامل کرنے سے صحیح بات کو مزید بہتر بناتا ہے.

GPT-SoVITS متوسط رفتار پر چلتا ہے اور بہترین، قریب-سٹوڈیو-کیو لیت آؤٹ پوڈکٹ بناتا ہے یہ ہلکے ماڈل جیسے پیپر یا کوکورو کے مقابلے میں ایک چھوٹی سی رفتار تجارت کرتا ہے زیادہ قدرتی، اظہاری کلونی کلام کے بدلے میں.

GPT-SoVITS ایک پرائم ٹیئر ماڈل ہے، جس کی قیمت 25 کریڈٹ پر 1000 حروف ہے۔ یہ معیاری ٹیئر (10 کریڈٹ) سے اوپر ہے لیکن Tortoise اور StyleTTS2 (50 کریڈٹ) جیسے الٹرا ٹیئر ماڈلز سے نیچے ہے۔

دونوں پرائم ٹیئر وائٹ کلونینگ انجن ہیں جو تجارتی استعمال کے لئے لائسنس کیے گئے ہیں GPT-SoVITS کو روا کلونینگ فیدلیٹی اور کراس زبانوں پر پروزودی پر جیتنے کی رجحان ہے، جب کہ CosyVoice2 (Apache 2.0) مضبوط کثیر زبانوں کو کوڈنگ فراہم کرتا ہے دونوں کو TextToSpeechAI پر مفت آزمائیں اور اپنا مقصد آواز سے سب سے بہتر مطابقت رکھنے والا ایک منتخب کریں.

ہاں۔ ایک دفعہ شروع کر نے کے ليے مفت TextToSpeechAI اکاؤنٹ کے ليے رجسٽري کريں يا ديمو استعمال کريں GPT-SoVITS کو بغیر اکاؤنٹ کے سننے کے ليے۔ يه آواز کي کلوننگ کے ليے کافي هے اور يک کريٹ پيک خريد کر نے سے پہلے معيار کي جانچ کريں

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try GPT-سو ویٹس Now

Generate your first audio free. No credit card required.

Start Free