পকেট TTS

Standard

CPU-এ বাস্তব-সময়ে চলমান অতিরিক্ত-হালকা ভয়েস ক্লোনিং

Very Fast গতি
Good গুণমান
হ্যাঁ ক্লোনিং
2 ভাষা

পরিচিতি পকেট TTS

Pocket TTS by Kyutai is an ultra-lightweight 100M parameter text-to-speech model that runs in real-time on CPU. Despite its tiny size, it supports voice cloning from just 5 seconds of reference audio. Perfect for edge deployment, mobile applications, and scenarios where GPU resources are limited. Currently supports English and French.

প্রধান বৈশিষ্ট্য

অতি- হালকা

১০০ এম প্যারামিটার - সিপিইউ- এ ন্যূনতম রিসোর্স ব্যবহার করে বাস্তব- সময়ে চালানো হয় ।

শব্দ ক্লোনিং

সিপিইউতেও, রেফারেন্স অডিও থেকে মাত্র ৫ সেকেন্ড থেকে যেকোন শব্দ ক্লোন করুন।

সিপিইউ- এ রিয়েল- টাইম

কোন GPU প্রয়োজন নেই। প্রমিত হার্ডওয়্যারের উপর বাস্তব সময়ের গতিবেগে কথা বলার জন্য তৈরি করা হয়।

প্রান্ত- প্রস্তুত

মোবাইল ডিভাইস, রাসবেরি পাই এবং embedded সিস্টেমের জন্য যথেষ্ট ছোট।

ব্যবহারের ক্ষেত্রে

প্রান্ত এবং মোবাইল বিকাশ সিপিইউ-তে বাস্তব-সময়ের ভয়েস সহায়ক IoT এবং অন্তর্ভুক্ত ডিভাইস কম-সম্পদ ভয়েস ক্লোনিং

ব্যবহারের নিয়ম পকেট TTS

  1. 1

    বিনামূল্যে নিবন্ধন করুন অথবা ডেমো চেষ্টা করুন

    Create a free TextToSpeechAI account to receive starter credits, or use the on-site demo to hear Pocket TTS before signing up. No GPU or local install is needed.

  2. 2

    Pocket TTS নির্বাচন করুন এবং ক্লোন করার জন্য একটি শব্দ যোগ করুন

    আপনার ইঞ্জিন হিসেবে Pocket TTS বেছে নিন, তারপর সেই কন্ঠের ক্লোন করার জন্য ৫ থেকে ১০ সেকেন্ডের একটি সংক্ষিপ্ত রেফারেন্স ক্লিপ আপলোড করুন। Pocket TTS সম্পূর্ণরূপে সিপিইউ-তে চলে, তাই ক্লোন করা দ্রুত এবং হালকা।

  3. 3

    আপনার লেখা লিখুন

    আপনি যে ইংরেজি বা ফরাসি লেখাটি উচ্চারণ করতে চান তা টাইপ করুন অথবা সাঁটান। অক্ষর সংখ্যার দিকে নজর রাখুন, কারণ Pocket TTS প্রতি ১০০০ অক্ষরের জন্য ১০ ক্রেডিট প্রযোজ্য।

  4. 4

    অডিও তৈরি করুন

    ক্লিক করে তৈরি করুন এবং Pocket TTS আপনার টেক্সটকে ক্লোন করা শব্দে বাস্তব সময়ের গতিবেগে সংশ্লেষিত করবে। বেশিরভাগ ক্লিপ সেকেন্ডের মধ্যেই তৈরি হয়ে যাবে কারণ মডেলটি খুবই ছোট এবং CPU-নির্ভর।

  5. 5

    API ডাউনলোড অথবা ব্যবহার করুন

    Download the finished audio, or automate generation through the TextToSpeechAI REST API at api.texttospeechai.com using your account token. The API exposes the same Pocket TTS cloning and synthesis for your own apps.

পকেট TTS অ্যাপলিকেশন প্রযুক্তিগত উপযোগিতা (API)

TextToSpeechAI REST API ব্যবহার করে প্রোগ্রামিং দ্বারা বাক্যের উৎপাদন করুন।

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "পকেট টিটিএস শব্দের ক্লোনিং প্রদান করে যা সিপিইউতেও বাস্তব সময়ে চলবে।",
    "voice": "en_US-lessac-medium"
  }'

প্রায়শই জিজ্ঞাসিত প্রশ্ন

Pocket TTS একটি অতি-হালকা টেক্সট-টু-স্পিকার মডেল যা কেবল ১০০ মিলিয়ন প্যারামিটার সহ Kyutai থেকে আসে। এটি সিপিইউতে বাস্তব সময়ে চলতে পারে এবং ৫ সেকেন্ডের অডিও থেকে শব্দ ক্লোনিং সমর্থন করে।

পকেট টিটিএস সিসি-বাই-৪.০ লাইসেন্সের অধীনে, যা বাণিজ্যিক ব্যবহারের অনুমতি দেয়। বাণিজ্যিক অ্যাপ্লিকেশনে ব্যবহারের সময় আপনাকে কিউতাইকে ক্রেডিট দিতে হবে।

বর্তমানে Pocket TTS ইংরেজি এবং ফরাসি ভাষা সমর্থন করে। ভবিষ্যতে আরও ভাষা যোগ করা হতে পারে।

হ্যাঁ! শুধুমাত্র ১০০ মেগাবাইট প্যারামিটার সহ, Pocket TTS প্রমিত CPU হার্ডওয়্যারের উপর বাস্তব সময়ের গতিবেগে চলবে। কোন GPU এর প্রয়োজন নেই, যা এটিকে প্রান্তীয় প্রয়োগ এবং মোবাইল অ্যাপ্লিকেশনের জন্য আদর্শ করে তোলে।

উভয়ই হালকা এবং সিপিইউ- এ ভালভাবে চলতে পারে । পকেট টিটিএস অনন্যভাবে ভয়েস ক্লোনিং সমর্থন করে (কোকোরো করে না) । কোকোরো আরও বেশি ভাষা সমর্থন করে (৯ বনাম ২) । যদি আপনার হালকা ভয়েস ক্লোনিং প্রয়োজন হয়, তাহলে পকেট টিটিএস বেছে নিন, যদি আরও বেশি ভাষার সমর্থন প্রয়োজন হয়, তাহলে কোকোরো বেছে নিন ।

৫ সেকেন্ড রেফারেন্স অডিও প্রদান করুন। Pocket TTS স্পিকারের বৈশিষ্ট্য উদ্ধার করে এবং সেই কন্ঠে নতুন কথা তৈরি করতে পারে। দীর্ঘ রেফারেন্সের সাথে গুণমান উন্নত হয় (১০ সেকেন্ড পর্যন্ত)।

হ্যাঁ। GPU এর প্রয়োজনীয় অধিকাংশ ক্লোন মডেলের বিপরীতে, Pocket TTS এর ক্ষুদ্র ১০০M প্যারামিটার ফটপ্রিন্টের কারণে CPU-তে সম্পূর্ণ শূন্য-শট ভয়েস ক্লোনিং সম্পাদন করে। আপনি এমনকি একটি ল্যাপটপ বা একক-বোর্ড কম্পিউটারে একটি সংক্ষিপ্ত ক্লিপ থেকে একটি ভয়েস ক্লোন করতে পারেন।

পকেট টিটিএস সিসি-বাই-৪. ০ এর অধীনে প্রকাশিত হয়েছে, তাই আপনি যদি এটি ব্যবহার করেন বা পুনরায় বিতরণ করেন, তাহলে অবশ্যই কুতাইকে মূল সৃষ্টিকর্তা হিসেবে উল্লেখ করতে হবে। "কুতাইর পকেট টিটিএস ব্যবহার করে তৈরি করা শব্দ" এর মতো একটি সহজ উল্লেখ বাণিজ্যিক এবং অবাণিজ্যিক উভয় ক্ষেত্রেই লাইসেন্সের শর্ত পূরণ করে।

Pocket TTS একটি প্রমিত CPU-তে বাস্তব-সময়ে বা তার চেয়ে দ্রুততরভাবে কথা তৈরি করে, GPU-র প্রয়োজন নেই। এটি এটিকে সবচেয়ে দ্রুত প্রতিক্রিয়াশীল ইঞ্জিন হিসেবে তৈরি করে যা কম-লাটেন্সি ব্যবহারের ক্ষেত্রে ব্যবহার করা যায় যেমন লাইভ ভয়েস অ্যাসিস্ট্যান্ট এবং ডিভাইস-ভিত্তিক উৎপাদন।

Pocket TTS is in the standard pricing tier, costing 10 credits per 1,000 characters. That makes it one of the most economical voice-cloning options available on TextToSpeechAI.

উভয়ই হালকা, সিপিইউ- বন্ধুত্বপূর্ণ, স্ট্যান্ডার্ড- স্তর ইঞ্জিন । পকেট TTS বেছে নিন যখন আপনার ভয়েস ক্লোন করার প্রয়োজন হয়, যেহেতু Kokoro এটি সমর্থন করে না । Kokoro বেছে নিন যখন আপনার বিস্তৃত ভাষার কভারেজ প্রয়োজন এবং একটি নির্দিষ্ট ভয়েস ক্লোন করার প্রয়োজন নেই ।

Yes. New TextToSpeechAI accounts receive free starter credits, and the on-site demo lets you hear Pocket TTS before committing. Sign up for free, upload a short reference clip, and generate cloned speech in seconds.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try পকেট TTS Now

Generate your first audio free. No credit card required.

Start Free