آواز

Premium

زرو-شٹ متعدد زبانوں کی آواز کلوننگ سٹریمنگ مدد کے ساتھ

Fast رفتار
Very Good معيار
ہاں کلوننگ
5 زبانیں

متعلقہ آواز

[Translation temporarily unavailable. Please try again.]

کلیدی خصوصیات

Zero-Shot آواز کلوننگ

3-10 سیکنڈ سے کوئی آواز کلون کریں 3-10 سیکنڈ سے کوئی آواز کلون کریں

چند زبانوں والا

چینی، انگریزی، جاپانی، کو ریاني، اور کانٹونین کو کراس-لنگوی ترکیب کے ساتھ مدد کرتا ہے.

اسٹریمنگ مدد

ریئل ٹائم ایپلیکیشنز اور تعاملی نظام کے لئے کم-لاتینسی اسٹریمنگ موڈ.

فطري نظم

اعلیٰ پروسوڈی ماڈلنگ مناسب انٹنیشن کے ساتھ قدرتی آواز کی بات بنانے میں مدد کرتی ہے۔

استعمال کے حالات

چند زبانوں کے مواد کا تخلیق ریئل ٹائم آواز مددگار کراس زباني دو بلينگ ذاتی آواز ایپلیکیشنز

استعمال کيونکر کريں آواز

  1. 1

    رجسٹر کریں اور مفت کریڈٹ کا مطالبہ کریں

    آپ کے شروع کر نے کے کرڈٹ کو مطالبہ کرنے کے ليے مفت TextToSpeechAI اکاؤنٹ بنايں يا پھر دمو کو آزمائيں. کوئی GPU يا مقامي CosyVoice2 انسٹاليشن نيا ں ضرورت هے - ہر شے ہمارے انفرا سٹرکچر پر چلتا هے

  2. 2

    CosyVoice2 منتخب کريں اور ريفرنس کلپ شامل کريں

    آپ کو عينک کے طور پر CosyVoice2 منتخب کريں ، پھر آپ کو 3-10 سيکنڈ کا صاف ريفرنس ریکارڈ اپ لوڈ کر نےيں جسے آپ کلون کرنا چا هيتے هيں CosyVoice2 صفر شٹ کثیر زبانوں کے کلوننگ کے ليے اسپيکر کي خاصيتوں کو نکال کريں گا

  3. 3

    آپ کا متن کسی بھی مدد شدہ زبان میں داخل کریں

    چيني، انگريزي، جاپاني، کو ري يا کانٹنينٹل زبان ميں اپنے ليکبندر کو ٹائپ کريں يا پيسٹ کريں CosyVoice2 کرس لنگويج سينتھز کو مدد ديتا هے ، اس ليے کلونڈ آواز ريفرنس کلپ سے مختلف زبان بول سکيں

  4. 4

    زبان بنا ئيں

    کلک کريں جنرائز اور CosyVoice2 کلونڈ آواز ميں فطري، کثیر زباني بولي سنتھز کريں ، عام طور پر مختصر متن کے ليے سيکنڈز ميں پرائمي-ٹائر استعمال کو 1000 حروف پر 25 کريٹز لگتے هيں

  5. 5

    API ڈائون لوڈ کریں یا استعمال کریں

    آپ کی تاریخ سے MP3 یا WAV کے طور پر ختم شدہ آڈیو ڈائون لوڈ کریں، یا خودکار CosyVoice2 آواز کلوننگ کو TextToSpeechAI REST API کے ذریعے پیمانے پر.

آواز API

TextToSpeechAI REST API کے استعمال سے پروگرامنگ کے طور پر بولي پيدا کريں

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "CosyVoice2 صفر\u002Dشٹ آواز کلوننگ صلاحیت کے ساتھ قدرتی متعدد زبانوں کی بات چیت فراہم کرتا ہے.",
    "voice": "en_US-lessac-medium"
  }'

بار بار پوچھے گئے سوالات

CosyVoice2 FunAudioLLM (Alibaba) سے آتے آے ے آخري نسل کے متن سے بولنے اور آواز کلوننگ ماڈل هے ۔ اس ميں ذرو شٹ آواز کلوننگ کي مدد هے اور چيني ، انگريزي ، جاپاني ، کو رياني اور کانٹو ني زبان ميں فطري بولنے کو سنتھز کر سکتا هے ۔ TextToSpeechAI پر آپ کو براؤزر ميں کوسي ويز2 کو چلا سکتے هيں

ہاں، CosyVoice2 مکمل طور پر Apache 2.0 لائسنس ہے - کوڈ اور ماڈل وزن دونوں. یہ اسے تجارتی مصنوعات میں استعمال کرنے کے لئے محفوظ بناتا ہے، ادا کردہ مواد، اور لائسنس فیس یا غیر تجارتی پابندیوں کے بغیر کلائنٹ کام.

CosyVoice2 پانچ زبانوں کو مدد دے تا هے: چيني (منڈرين)، انگريز ، جاپاني ، کو ري ، اور کانٹو ني. یہ کراس زباني سنتھز کو بھی ہینڈل کر تا هے ، تو آپ ایک زبان میں ريجو رے سے آواز کي کلون کر سکتے هيں اور دوسرا زبان میں بول سکتے هيں

3-10 سيکنڈ کے صاف حوالہ آ ديو کو مراد اسپیکر کے عطا کريں CosyVoice2 اسپيکر کی خاصيتوں کو عين عين Scalar Quantization کے طريقے سے نکالتا هے پھر اس کے مدد شدہ زبانوں میں سے کسی بھی زبان میں اس کلونڈ آواز میں نئے کلام کو پيدا کر تا هے کوئی ماڈل تربيت يا Fine-Tuning کا ضرورت نهيں هے

CosyVoice2 ایک مضبوط کثیر زبانوں کے کلوننگ ماڈل میں سے ایک ہے، کہ اس وقت بھی کہ ایک زبان میں ایک مختلف زبان میں بات کرنے کے وقت بھی اسپیکر کی شناخت کو محفوظ رکھتا ہے. یہ قدرتی prosody اور intonation پیدا کرتا ہے، جو اسے کراس زبانوں کے ڈبنگ اور مقامی مواد کے لئے مناسب بناتا ہے.

ہاں۔ CosyVoice2 ایک تیز ماڈل ہے اور اس میں ایک سٹریمینگ موڈ شامل ہے جو کم لیٹنس کے ساتھ اوڈيو پیدا کرتا ہے، اسے آواز کے معاون اور تعاملی ایپلیکیشنوں کے لئے مناسب بناتا ہے۔ TextToSpeechAI نسلوں پر عام طور پر مختصر متن کے لئے سیکنڈ میں مکمل ہوتا ہے۔

CosyVoice2 کو 0.5B پیرامیٹر ماڈل کے ليے VRAM کے 4-6GB کا احتياج هے، اس ليے 6GB يا اس سے زائد GPU کے ليے خود مہمان بننے کے ليے سفارش کيے جاتے هے. TextToSpeechAI پر ماڈل ہمارے GPU زير بنا پر چلتا هے، اس ليے آپ کو اپنے آپ کے ليے هيچ ہارڈر کا احتياج نهيں هے

CosyVoice2 ایک پرائم ٹیئر ماڈل ہے اور ہر 1000 حروف کے متن کے لیے 25 کریڈٹ کی قیمت ہے۔ ہر نیا اکاؤنٹ مفت شروع کریڈٹ حاصل کرتا ہے، تو آپ کو پیسے کے پلان پر فیصلہ کرنے سے پہلے CosyVoice2 وائٹ کلونینگ کی کوشش کر سکتے ہیں۔

دونوں پرائم وائٹ کلوننگ انجن ہیں.GPT-SoVITS اکثر ایک واحد مقصد آواز کے لئے سب سے زیادہ خام مشابهت تک پہنچتا ہے، جب کہ CosyVoice2 متعدد زبانوں اور کراس زبانوں کے کلوننگ کے لئے زیادہ مضبوط ہے اور ایک کم-لاتینسی اسٹریمنگ موڈ شامل کرتا ہے. CosyVoice2 کو منتخب کریں جب آپ کو ایک کلون آواز کی ضرورت ہوتی ہے کئی زبانوں کو بولنے کے لئے.

دونوں ہی اعلیٰ معیار کے صفر-شٹ آواز کلوننگ کی پیشکش کرتے ہیں. CosyVoice2 زیادہ زبانوں کو مدد دیتا ہے (5 مقابلے میں 2) اور ریئل-ٹائم استعمال کے لئے اسٹریمنگ شامل کرتا ہے، جبکہ F5-TTS صرف انگریزی کے کام کے لوڈ کے لئے تھوڑا تیز ہو سکتا ہے. متعدد زبانوں کے پروجیکٹوں کے لئے CosyVoice2 عام طور پر بہتر فٹ ہے.

TextToSpeechAI آپ کو MP3 اور WAV جیسے عام فارمیٹ میں CosyVoice2 نسلوں کو نکالنے کی اجازت دیتا ہے آپ براہ راست اپنی تاریخے کے صفحے سے فائلیں ڈاؤن لوڈ کر سکتے ہیں یا TextToSpeechAI API کے ذریعے پروگرامی طور پر اسے واپس لے سکتے ہیں

ہاں آپ کوسی وائٹس کو مفت ڈیمو اور اپنے مفت شروع کریڈٹ کے ساتھ TextToSpeechAI پر آزما سکتے ہیں بغیر کسی چیز کو انسٹال کرنے کے صرف رجسٹر کریں ، ایک مختصر حوالہ کلیپ اپ لوڈ کریں ، اپنے متن کو کسی بھی مدد شدہ زبان میں ٹائپ کریں اور پیدا کریں.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try آواز Now

Generate your first audio free. No credit card required.

Start Free