در مورد کوکورو
Kokoro is an ultra-lightweight 82M parameter TTS model that delivers natural-sounding speech at incredible speed. It runs near real-time even on CPU, making it ideal for applications where low latency is critical. Kokoro supports multiple languages and offers voice blending capabilities.
ویژگیهای کلیدی
سبکبار
پارامترهای ۸۲M، ~۳۰۰MB اندازه مدل. روی CPU با منابع کم اجرا میشود.
نزدیک به زمان واقعی
سرعت تولید گفتار سریعتر از سرعت پخش است، حتی بدون شتابدهنده GPU.
چند زبانه
از زبانهای انگلیسی، فرانسوی، اسپانیایی، هندی، ژاپنی، چینی، ایتالیایی، پرتغالی و کرهای پشتیبانی میکند.
ترکیب صدا
دو صدا را با هم ترکیب کنید تا ترکیبهای منحصر به فردی را ایجاد کنید.
موارد استفاده
چطور استفاده شود کوکورو
-
1
ثبت نام رایگان یا آزمایش نمایشی
Create a free TextToSpeechAI account to get 200 starter credits, or use the no-signup demo to hear Kokoro instantly. The standard tier means Kokoro only costs 10 credits per 1000 characters.
-
2
صدای کوکورو را انتخاب کنید
باز کردن مرورگر صدا و انتخاب یک صدای Kokoro در زبان هدف خود (۹ پشتیبانی شده ، از انگلیسی تا ژاپنی و کرهای). همچنین میتوانید از ترکیب صدای Kokoro برای ترکیب دو صدا به یک ترکیب سفارشی استفاده کنید.
-
3
وارد کردن متن
متنی را که میخواهید به عنوان گفتار در ویرایشگر تایپ یا چسبیده شود. Kokoro به لطف پارامتر ۸۲M سبک وزن و موتور نزدیک به زمان واقعی ، گذرگاههای طولانی را به صورت کارآمد مدیریت میکند.
-
4
تنظیم سرعت و تولید
سرعت پخش را برای مورد استفادهتان تنظیم کنید ، سپس تولید را فشار دهید. Kokoro صدا را سریعتر از زمان واقعی نمایش میدهد ، بنابراین گفتار شما تقریباً بلافاصله آماده است.
-
5
دانلود یا استفاده از API
دانلود صوت نهایی به صورت MP3 یا WAV، یا تولید خودکار از طریق TextToSpeechAI REST API در api.texttospeechai.com برای بارهای کاری بسته و زمان واقعی.
کوکورو API
تولید گفتار به صورت برنامهریزی شده با استفاده از REST API TextToSpeechAI.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "کوکورو با سرعت و کارایی باورنکردنی سخنرانی طبیعی ارائه میدهد.",
"voice": "en_US-lessac-medium"
}'
پرسشهای متداول
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 9
- GPU VRAM CPU OK
- Credits/1000 chars 10