কোকোরোName

Standard

প্রাকৃতিক গুণমানের সাথে বিদ্যুৎ-দ্রুত, হালকা TTS

Very Fast গতি
Good গুণমান
না ক্লোনিং
9 ভাষা

পরিচিতি কোকোরোName

Kokoro is an ultra-lightweight 82M parameter TTS model that delivers natural-sounding speech at incredible speed. It runs near real-time even on CPU, making it ideal for applications where low latency is critical. Kokoro supports multiple languages and offers voice blending capabilities.

প্রধান বৈশিষ্ট্য

অতি- হালকা

৮২ এমবি প্যারামিটার, ~৩০০ এমবি মডেল আকার। সিপিইউ-তে কম রিসোর্স ব্যবহার করে চালানো হয়।

প্রায় বাস্তব সময়

GPU এক্সেলরেশন ছাড়াও, প্লেব্যাকের গতি থেকে দ্রুততরভাবে কথা তৈরি করে।

বহুভাষিক

ইংরেজি, ফরাসি, স্প্যানিশ, হিন্দি, জাপানি, চীনা, ইতালিয়ান, পর্তুগিজ এবং কোরীয় ভাষা সমর্থন করে।

শব্দ মিশ্রণ

অসাধারণ শব্দের সংমিশ্রণ তৈরি করতে দুইটি শব্দ একসাথে মিশ্রিত করুন।

ব্যবহারের ক্ষেত্রে

বাস্তব-সময়ের চ্যাটবট এবং ভার্চুয়াল সহায়ক লাইভ স্ট্রিমিং টেক্সট-টু-স্পিকার প্রান্ত বিনির্মাণ এবং মোবাইল অ্যাপ্লিকেশন উচ্চ-ভলিউম ব্যাচ প্রসেসিং

ব্যবহারের নিয়ম কোকোরোName

  1. 1

    বিনামূল্যে নিবন্ধন করুন অথবা ডেমো চেষ্টা করুন

    Create a free TextToSpeechAI account to get 200 starter credits, or use the no-signup demo to hear Kokoro instantly. The standard tier means Kokoro only costs 10 credits per 1000 characters.

  2. 2

    একটি Kokoro শব্দ নির্বাচন করুন

    শব্দ ব্রাউজার খুলুন এবং আপনার লক্ষ্য ভাষায় একটি Kokoro শব্দ নির্বাচন করুন (৯টি সমর্থিত, ইংরেজি থেকে জাপানি এবং কোরীয়)। আপনি দুইটি শব্দকে স্বনির্বাচিত একটি সংমিশ্রণে মিশ্রিত করতে Kokoro শব্দ মিশ্রণ ব্যবহার করতে পারেন।

  3. 3

    আপনার লেখা লিখুন

    আপনি যে লেখাটি লিখতে চান তা টাইপ করুন অথবা এডিটর-এ পেস্ট করুন। কোকোরো এর হালকা ৮২M-প্যারামিটার, প্রায় বাস্তব-সময়ের ইঞ্জিনকে ধন্যবাদ, দীর্ঘ অংশগুলি দক্ষতার সাথে পরিচালনা করে।

  4. 4

    গতি এবং উৎপাদন সংশোধন করুন

    আপনার ব্যবহারের ক্ষেত্রের সাথে সামঞ্জস্যপূর্ণভাবে প্লেব্যাকের গতি নির্ধারণ করুন, তারপর তৈরি করুন ক্লিক করুন। Kokoro অডিওকে বাস্তব সময়ের চেয়ে দ্রুততর করে, তাই আপনার বক্তব্য প্রায় তৎক্ষণাৎ প্রস্তুত হয়ে যাবে।

  5. 5

    API ডাউনলোড অথবা ব্যবহার করুন

    Download the finished audio as MP3 or WAV, or automate generation through the TextToSpeechAI REST API at api.texttospeechai.com for batch and real-time workloads.

কোকোরোName অ্যাপলিকেশন প্রযুক্তিগত উপযোগিতা (API)

TextToSpeechAI REST API ব্যবহার করে প্রোগ্রামিং দ্বারা বাক্যের উৎপাদন করুন।

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "কোকোরো অসাধারণ গতিতে এবং দক্ষতার সাথে প্রাকৃতিক ভাষায় কথা বলে।",
    "voice": "en_US-lessac-medium"
  }'

প্রায়শই জিজ্ঞাসিত প্রশ্ন

কোকোরো একটি অতি হালকা টেক্সট-টু-স্পিকার মডেল যার মাত্র ৮২ মিলিয়ন প্যারামিটার রয়েছে। এর ছোট আকার সত্ত্বেও, এটি একাধিক ভাষার মধ্যে প্রকৃত সময়ের গতিবেগে প্রাকৃতিক শব্দের মত শব্দ তৈরি করে, এমনকি সিপিইউ-তেও।

হ্যাঁ, Kokoro সম্পূর্ণভাবে Apache 2.0 লাইসেন্সপ্রাপ্ত - কোড এবং মডেল উভয়ই। এটি বাণিজ্যিক অ্যাপ্লিকেশনে কোন প্রতিবন্ধকতা ছাড়াই ব্যবহার করা যেতে পারে।

কোকোরো ইংরেজি (আমেরিকান এবং ব্রিটিশ), ফরাসি, স্প্যানিশ, হিন্দি, জাপানি, চীনা, ইতালিয়ান, পর্তুগিজ এবং কোরীয় ভাষা সমর্থন করে।

Kokoro সবচেয়ে দ্রুততম TTS মডেলগুলির মধ্যে একটি। এটি সিপিইউ-তে বাস্তব-সময়ের প্লেব্যাকের চেয়েও দ্রুততরভাবে কথা তৈরি করে, যা এটিকে মিথস্ক্রিয় অ্যাপ্লিকেশনের জন্য আদর্শ করে তোলে।

না, Kokoro শব্দের ক্লোনিং সমর্থন করে না। এটি শব্দ মিশ্রণ ক্ষমতা সহ একটি সংরক্ষিত শব্দ লাইব্রেরী ব্যবহার করে। শব্দ ক্লোনিং-এর জন্য, F5-TTS, Chatterbox, StyleTTS2, OpenVoice, অথবা Tortoise ব্যবহার করুন।

Kokoro দুইটি কন্ঠ একত্রে মিশিয়ে অসাধারণ সংমিশ্রণ তৈরি করতে পারে। এটি আপনাকে ঐতিহ্যবাহী কন্ঠ ক্লোনিং ছাড়াই স্বনির্বাচিত কন্ঠ বৈশিষ্ট্য তৈরি করতে দেয়।

উভয়ই দ্রুত, হালকা মডেল । Kokoro এর আরো আধুনিক স্থাপত্য এবং শব্দ মিশ্রণ সমর্থন করে, যখন Piper এর একটি বড় শব্দ লাইব্রেরী আছে । উভয়ই বাস্তব- সময়ের অ্যাপ্লিকেশনের জন্য চমৎকার ।

Kokoro সিপিইউ-তে চালানোর জন্য ডিজাইন করা হয়েছে এবং এর জন্য সর্বনিম্ন রিসোর্স প্রয়োজন - প্রায় ৩০০ মেগাবাইট। কোন GPU-র প্রয়োজন নেই, যদিও GPU-এর দ্রুতগতির জন্য আরও দ্রুত প্রসেসিং সমর্থিত।

হ্যাঁ। Kokoro সিপিইউ-তে প্লেব্যাকের চেয়ে দ্রুততরভাবে কথাবার্তা তৈরি করে, খুব কম সময়ের মধ্যে, তাই এটি চ্যাটবট, ভয়েস অ্যাসিস্ট্যান্ট এবং লাইভ স্ট্রিমিং-এর জন্য একটি চমৎকার উপযুক্ত। এর ৮২M-প্যারামিটার আকার মেমরি ব্যবহারকে ছোট করে রাখে, যা উচ্চ-ভলিউম এবং প্রান্তের জন্য এটিকে কার্যকর করে তোলে।

Voice blending lets you mix two Kokoro voices together to create a unique combination with custom characteristics. It is not traditional voice cloning - you cannot reproduce a specific person from a sample - but it gives you more variety than a fixed voice library. You can experiment with blends directly in the TextToSpeechAI editor.

উভয়ই দ্রুত, সিপিইউ- বন্ধুত্বপূর্ণ, স্বর ক্লোনিং ছাড়াই মান- স্তর ইঞ্জিন । কোকোরো সবচেয়ে হালকা (প্রায় ৩০০ মেগাবাইট) এবং ৯টি ভাষার মধ্যে স্বর মিশ্রণ সমর্থন করে, যেখানে মেলোটিটিএস একাধিক ইংরেজি উচ্চারণ এবং বাস্তব- সময়ের বহুভাষিক আউটপুট- এর উপর ফোকাস করে । সবচেয়ে ছোট পদচিহ্ন এবং মিশ্রণের জন্য কোকোরো বেছে নিন; নির্দিষ্ট উচ্চারণের প্রয়োজন হলে মেলোটিটিএস বেছে নিন ।

Kokoro is a standard-tier engine, costing 10 credits per 1000 characters - the lowest tier on TextToSpeechAI. New accounts get 200 free credits, so you can try Kokoro without paying. This makes it one of the most cost-effective ways to generate high-quality speech at scale.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try কোকোরোName Now

Generate your first audio free. No credit card required.

Start Free