جعبه گفتگو

Premium

شبیه‌سازی صدای صفر-تیر با سخنرانی بیانی در ۲۳ زبان

Fast سرعت
Very Good کیفیت
آره شبیه‌سازی
23 زبانها

در مورد جعبه گفتگو

Chatterbox is a powerful voice cloning TTS model from Resemble AI. It performs zero-shot voice cloning from just a few seconds of reference audio, supporting 23 languages with natural expression. Chatterbox includes paralinguistic tags for adding natural sounds like laughter and coughs to generated speech.

ویژگیهای کلیدی

شبیه‌سازی صدای Zero-Shot

هر صدایی را از چند ثانیه صدا کپی کنید - هیچ آموزشی لازم نیست.

زبان ۲.

از عربی تا چینی، که بیشتر زبان‌های بزرگ دنیا را پوشش می‌دهد.

برچسبهای بیانگر

اضافه کردن [خنده]، [سرفه]، [خنده] برای صداهای طبیعی پارازبانی.

استنتاج سریع

تاخیر زیر ۲۰۰ مگابیت با توربو برای برنامه‌های زمان واقعی.

موارد استفاده

شبیه‌سازی صدا برای ایجاد محتوا کاربردهای صدای چندزبانهName طراحی صدای شخصیت‌ها برای بازی‌ها دستیارهای شخصی صدا

چطور استفاده شود جعبه گفتگو

  1. 1

    ثبت نام یا باز کردن نمایش

    Create a free TextToSpeechAI account to claim 200 starter credits, or use the on-page demo to try Chatterbox without signing in.

  2. 2

    انتخاب Chatterbox و اضافه کردن ویدئو مرجع

    موتور Chatterbox را انتخاب کنید ، سپس یک کلیپ صوتی کوتاه (چند ثانیه) از صدایی که می‌خواهید شبیه سازی کنید را بارگذاری کنید. Chatterbox Zero-Shot آن را بلافاصله شبیه سازی می‌کند - هیچ آموزشی نیاز نیست.

  3. 3

    وارد کردن متن با برچسبهای اختیاری

    متن را تایپ یا کپی کنید تا به هر یک از ۲۳ زبان پشتیبانی شده صحبت کنید و برچسب‌های [خنده]، [سرفه] یا [خنده] را در هر جایی که صداهای طبیعی پارازبانی را می‌خواهید، بگذارید.

  4. 4

    تولید گفتار

    Click generate and TextToSpeechAI renders your text in the cloned Chatterbox voice on hosted GPU infrastructure, spending 25 credits per 1,000 characters.

  5. 5

    دانلود یا استفاده از API

    فایل صوتی نهایی را دانلود کنید، یا تولید خودکار را از طریق REST API TextToSpeechAI در api.texttospeechai.com با استفاده از توکن حساب خود انجام دهید.

جعبه گفتگو API

تولید گفتار به صورت برنامه‌ریزی شده با استفاده از REST API TextToSpeechAI.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "چاترباکس می‌تواند صدای شما را از چند ثانیه صدا کپی کند و به ۲۳ زبان صحبت کند.",
    "voice": "en_US-lessac-medium"
  }'

پرسشهای متداول

این نرم‌افزار می‌تواند هر صدایی را از چند ثانیه صدای مرجع تکرار کند و سخنرانی طبیعی و بیانی را در ۲۳ زبان تولید کند، همه اینها بدون هیچ آموزشی برای هر صدا.

بله ، Chatterbox کاملاً تحت مجوز MIT است — هم کد و هم وزن مدل — بنابراین می‌توانید به صورت آزاد از آن در محصولات تجاری استفاده کنید. صدای تولید شده شامل یک علامت آبی عصبی اختیاری است که می‌تواند غیرفعال شود ، و هیچ حق امتیازی برای استفاده وجود ندارد.

شما یک کلیپ مرجع کوتاه از هر صدایی را ارائه می‌دهید (چند ثانیه کافی است) و Chatterbox آن صدا را در یک بلندگو جایگزین می‌کند. سپس سخنرانی جدیدی را در آن صدا بدون تنظیم دقیق یا گام آموزشی تولید می‌کند، که به معنی «شلیک صفر» است.

Chatterbox برچسب‌های ویژه در خط را در متن شما می‌خواند تا صداهای غیرکلامی طبیعی را اضافه کند: [خنده] خنده را وارد می‌کند ، [سرفه] سرفه را وارد می‌کند ، و [خنده] خنده نرم را وارد می‌کند. فقط یک برچسب را در جایی که صدا را می‌خواهید قرار دهید ، برای مثال « این خنده دار است [خنده] اما جدی...».

برچسب را مستقیماً در متن ورودی خود در جایی که صدا باید رخ دهد ، احاطه شده توسط بقیه جمله خود تایپ کنید. Chatterbox صدای پارازبانی را در صدای شبیه سازی شده ، با تلفیق آن با گفتار اطراف ، به گونه ای که به جای تلفیق ، خود به خود به نظر برسد ، نمایش می‌دهد.

چترباکس از ۲۳ زبان پشتیبانی می‌کند که شامل زبان‌های عربی، دانمارکی، آلمانی، یونانی، انگلیسی، اسپانیایی، فنلاندی، فرانسوی، عبری، هندی، ایتالیایی، ژاپنی، کره‌ای، مالایی، هلندی، نروژی، لهستانی، پرتغالی، روسی، سوئدی، سواحیلی، ترکی و چینی می‌شود.

Chatterbox به سرعت گفتار را در یک GPU تولید می‌کند، و نسخه توربو به تأخیر زیر ۲۰۰ میلی ثانیه برای استفاده مکالمه‌ای در زمان واقعی می‌رسد.

Chatterbox needs roughly 4-8GB of VRAM depending on the variant, with the Turbo model running comfortably in about 4GB. On TextToSpeechAI you do not need any local GPU - generation runs on our hosted infrastructure.

Chatterbox یک موتور سطح بالا است که هزینه آن ۲۵ کرید در هر ۱۰۰۰ کاراکتر است. حساب‌های جدید ۲۰۰ کرید رایگان برای آزمایش شبیه‌سازی صدا دریافت می‌کنند، و شما فقط کرید را برای متنی که در واقع تولید می‌کنید خرج می‌کنید.

هر دو از شبیه‌سازی صدای صفر-شلیک پشتیبانی می‌کنند، اما چاترباکس زبان‌های بیشتری را پوشش می‌دهد (۲۳ در مقابل ۲) و برچسب‌های پارازبانی بیانی را اضافه می‌کند.

هر دو شبیه‌سازی صدای با کیفیت بالا را ارائه می‌دهند. Chatterbox از ۲۳ زبان و برچسب‌های بیانی در خط پشتیبانی می‌کند، در حالی که OpenVoice کنترل‌های سبک صدا (دوست‌داشتنی، غمگین، عصبانی و غیره) را اضافه می‌کند که Chatterbox از آن‌ها محروم است. Chatterbox را برای پوشش گسترده زبان و OpenVoice را هنگامی که به سبک صدای احساسی صریح نیاز دارید، انتخاب کنید.

Yes. Sign up for a free TextToSpeechAI account to receive 200 starter credits, or use the on-page demo to hear Chatterbox without signing in. Upload a short reference clip, type your text, and generate a cloned voice in seconds.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try جعبه گفتگو Now

Generate your first audio free. No credit card required.

Start Free