جعبه گفتگو
Premiumشبیهسازی صدای صفر-تیر با سخنرانی بیانی در ۲۳ زبان
در مورد جعبه گفتگو
Chatterbox is a powerful voice cloning TTS model from Resemble AI. It performs zero-shot voice cloning from just a few seconds of reference audio, supporting 23 languages with natural expression. Chatterbox includes paralinguistic tags for adding natural sounds like laughter and coughs to generated speech.
ویژگیهای کلیدی
شبیهسازی صدای Zero-Shot
هر صدایی را از چند ثانیه صدا کپی کنید - هیچ آموزشی لازم نیست.
زبان ۲.
از عربی تا چینی، که بیشتر زبانهای بزرگ دنیا را پوشش میدهد.
برچسبهای بیانگر
اضافه کردن [خنده]، [سرفه]، [خنده] برای صداهای طبیعی پارازبانی.
استنتاج سریع
تاخیر زیر ۲۰۰ مگابیت با توربو برای برنامههای زمان واقعی.
موارد استفاده
چطور استفاده شود جعبه گفتگو
-
1
ثبت نام یا باز کردن نمایش
Create a free TextToSpeechAI account to claim 200 starter credits, or use the on-page demo to try Chatterbox without signing in.
-
2
انتخاب Chatterbox و اضافه کردن ویدئو مرجع
موتور Chatterbox را انتخاب کنید ، سپس یک کلیپ صوتی کوتاه (چند ثانیه) از صدایی که میخواهید شبیه سازی کنید را بارگذاری کنید. Chatterbox Zero-Shot آن را بلافاصله شبیه سازی میکند - هیچ آموزشی نیاز نیست.
-
3
وارد کردن متن با برچسبهای اختیاری
متن را تایپ یا کپی کنید تا به هر یک از ۲۳ زبان پشتیبانی شده صحبت کنید و برچسبهای [خنده]، [سرفه] یا [خنده] را در هر جایی که صداهای طبیعی پارازبانی را میخواهید، بگذارید.
-
4
تولید گفتار
Click generate and TextToSpeechAI renders your text in the cloned Chatterbox voice on hosted GPU infrastructure, spending 25 credits per 1,000 characters.
-
5
دانلود یا استفاده از API
فایل صوتی نهایی را دانلود کنید، یا تولید خودکار را از طریق REST API TextToSpeechAI در api.texttospeechai.com با استفاده از توکن حساب خود انجام دهید.
جعبه گفتگو API
تولید گفتار به صورت برنامهریزی شده با استفاده از REST API TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "چاترباکس میتواند صدای شما را از چند ثانیه صدا کپی کند و به ۲۳ زبان صحبت کند.",
"voice": "en_US-lessac-medium"
}'
پرسشهای متداول
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 23
- GPU VRAM 4-8GB
- Credits/1000 chars 25