Tortoise TTS

Ultra

অসাধারণ স্বাভাবিকতা সহ অতি উচ্চমানের কথাবার্তা

Very Slow গতি
Exceptional গুণমান
হ্যাঁ ক্লোনিং
1 ভাষা

পরিচিতি Tortoise TTS

s available. Tortoise TTS is an auto-regressive text-to-speech model that uses the best available audio quality to generate the most natural-sounding speech outputs available. Tortoise TTS is an auto-regressive text-to-speech model that uses the best available audio quality to generate the most natural-sounding speech outputs available. Tortoise TTS is an auto-regressive

প্রধান বৈশিষ্ট্য

অতি উচ্চমান

সবচেয়ে প্রাকৃতিক-স্বরযুক্ত TTS আউটপুট উপলব্ধ।

শব্দ ক্লোনিং

অসাধারণ বিশ্বাসযোগ্যতা এবং নরমতার সাথে কণ্ঠস্বর ক্লোন করুন।

প্রাকৃতিক শব্দভাণ্ডার

সুক্ষ্ম কথার নকশা এবং মাইক্রো-উপস্থাপনা ধারণ করে।

গুণগত মান

অতি দ্রুত থেকে উচ্চমানের প্রসেসিং বেছে নিন।

আবেগগত গভীরতা

সত্যিকারের আবেগিক প্রতিধ্বনি সহ কথাবার্তা তৈরি করে।

ওপেন সোর্স

বাণিজ্যিক ব্যবহারের অধিকার সহ লাইসেন্সকৃত অ্যাপাচি ২. ০।

ব্যবহারের ক্ষেত্রে

অডিও বই চলচ্চিত্র নির্মাণ ডকুমেন্টারি বর্ণনা পেশাদার ভয়েস- ওভার আর্কাইভ প্রকল্প উচ্চমানের বিষয়বস্তু

Tortoise TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

ব্যবহারের নিয়ম Tortoise TTS

  1. 1

    নিবন্ধন করুন অথবা বিনামূল্যে ডেমো চেষ্টা করুন

    Create a free TextToSpeechAI account to get starter credits, or use the homepage demo to try Tortoise without signing in. Tortoise is an Ultra-tier engine (50 credits per 1000 characters), so the free credits are perfect for a first short test.

  2. 2

    Tortoise নির্বাচন করুন এবং ক্লোন করার জন্য একটি শব্দ যোগ করুন

    শব্দ ব্রাউজার থেকে একটি Tortoise শব্দ নির্বাচন করুন। একটি নির্দিষ্ট ব্যক্তির ক্লোন করতে, একটি রেফারেন্স ক্লিপ আপলোড করুন (আদর্শভাবে কিছু পরিষ্কার ৫-১০ সেকেন্ডের নমুনা) এবং Tortoise উচ্চ-মানের নির্ভরযোগ্যতার সাথে সেই শব্দটি পুনরুদ্ধার করবে। অন্যথায় Tortoise এর অভ্যন্তরীণ শব্দের মধ্যে একটি নির্বাচন করুন।

  3. 3

    আপনার লেখা লিখুন

    আপনি যে লেখাটি বর্ণনা করতে চান তা টাইপ করুন অথবা সাঁটান। Tortoise ধীর গতির হওয়ায়, একটি পূর্ণ অডিওবই অধ্যায় অথবা দীর্ঘ স্ক্রিপ্ট পাঠানোর পূর্বে শব্দ ও টোন নিশ্চিত করার জন্য একটি সংক্ষিপ্ত অংশ দিয়ে শুরু করুন।

  4. 4

    একটি গুণগত মান প্রাক-নির্ধারণ করে তৈরি করুন

    Tortoise-এর একটি গুণগত মান পূর্বনির্ধারিত নির্বাচন করুন: দ্রুত পরীক্ষার জন্য অতিরিক্ত দ্রুত, ভাল গতি/গুণগত মান ভারসাম্যের জন্য দ্রুত (অনুমোদিত ডিফল্ট), মানক, অথবা সর্বোচ্চ বাস্তবতা অর্জন করার জন্য উচ্চ_গুণগত মানের। তারপর তৈরি করতে ক্লিক করুন এবং ধৈর্য ধরুন - Tortoise-র প্রতিটি ক্লিপ তৈরি করতে ৩০ সেকেন্ড থেকে কয়েক মিনিট সময় লাগতে পারে, বিশেষ করে উচ্চতর গুণগত মানের ক্ষেত্রে।

  5. 5

    API ডাউনলোড অথবা ব্যবহার করুন

    উত্‍পাদন শেষ হলে, আপনার অডিও MP3, WAV, অথবা OGG হিসাবে ডাউনলোড করুন, অথবা আপনার ইতিহাস থেকে এটি পান। Tortoise কাজ স্বয়ংক্রিয় করতে, TextToSpeechAI API কল করুন এবং আপনার নির্বাচিত গুণগত মান প্রাক-নির্ধারণ করুন - Tortoise ধীরে রেন্ডার করার কারণে দীর্ঘ সময়ের জন্য সময়সীমা অনুমোদন করতে ভুলবেন না।

Tortoise TTS অ্যাপলিকেশন প্রযুক্তিগত উপযোগিতা (API)

TextToSpeechAI REST API ব্যবহার করে প্রোগ্রামিং দ্বারা বাক্যের উৎপাদন করুন।

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "টর্টোয়িস এর জন্য সময় লাগে, কিন্তু ফলাফলের জন্য অপেক্ষা করা উচিত।",
    "voice": "tortoise-angie"
  }'

প্রায়শই জিজ্ঞাসিত প্রশ্ন

Tortoise TTS একটি স্বয়ংক্রিয়ভাবে পুনরাবৃত্তিশীল টেক্সট-টু-স্পীচ মডেল যা James Betker দ্বারা তৈরি করা হয়েছে এবং যা অন্যান্য সবকিছুর চেয়ে অডিও গুণমানকে প্রাধান্য দেয় । এটি ট্রান্সফরমার ভিত্তিক ভাষা মডেলিং এবং ডিফ্যুশন ডিকোডিং এর সমন্বয় করে অসাধারণ স্বাভাবিকতা, আবেগগত গভীরতা এবং মানব-সদৃশ শব্দার্থের সাথে কথা বলার সৃষ্টি করে । এটিকে সর্বত্র সবচেয়ে বাস্তবসম্মত ওপেন সোর্স TTS ইঞ্জিন হিসেবে বিবেচনা করা হয় ।

হ্যাঁ। Tortoise TTS একটি উন্মুক্ত উৎস অনুমোদনকারী অ্যাপাচি ২. ০ লাইসেন্সের অধীনে, যা বাণিজ্যিক ব্যবহার, পরিবর্তন এবং পুনঃবিতরণ অনুমোদন করে। TextToSpeechAI-এ, Tortoise আল্ট্রা স্তরে প্রতি ১০০০ অক্ষরের জন্য ৫০ ক্রেডিট-এ বসেছে কারণ এর ভারী গণনা প্রয়োজনীয়তা এবং অসাধারণ আউটপুট গুণমান।

Tortoise এর নকশা ধীর: এটি স্বয়ংক্রিয়ভাবে বেশ কয়েকটি প্রার্থী ক্লিপ তৈরি করে এবং তারপর একটি ডিফ্যুশন মডেল এবং একটি CLVP পুনরায় রেঙ্কিং পদক্ষেপ ব্যবহার করে সেরাটিকে পরিষ্কার করে। এই গুণগত মান-প্রথম পাইপলাইনের অর্থ হল একটি একক ক্লিপ লেখার দৈর্ঘ্য এবং গুণগত মান পূর্বনির্ধারিত নির্ভর করে ৩০ সেকেন্ড থেকে কয়েক মিনিট পর্যন্ত সময় নিতে পারে। লেনদেন হল যে Tortoise যেকোন TTS ইঞ্জিনের সবচেয়ে প্রাকৃতিক কথাবার্তার কিছু তৈরি করে।

Tortoise offers four presets that trade speed for quality: ultra_fast (~10x faster, good for testing), fast (~4x faster, the production default), standard (balanced), and high_quality (maximum quality, slowest). Higher presets sample more candidates and run more diffusion steps before selecting the best result. On TextToSpeechAI you can pick a preset before generating.

হ্যাঁ, Tortoise TTS অসাধারণ বিশ্বাসযোগ্যতার সাথে ভয়েস ক্লোনিং সমর্থন করে। লক্ষ্য ভয়েসের কয়েকটি সংক্ষিপ্ত রেফারেন্স ক্লিপ প্রদান করুন (আদর্শভাবে ৩-১০টি ৫-১০ সেকেন্ডের নমুনা), এবং Tortoise স্পিকারের টিমব্রে, উচ্চারণ, পেসিং এবং সূক্ষ্ম মাইক্রো-অনুপ্রকাশ ধারণ করে। এটি সবচেয়ে সঠিক শূন্য-শট ক্লোনিং ইঞ্জিনের মধ্যে একটি, যদিও ক্লোনিং ইতিমধ্যেই দীর্ঘ প্রজনন সময় যোগ করে।

Tortoise মূলত ইংরেজি ভাষার কথা বলার তথ্যসেট ব্যবহার করে প্রশিক্ষিত, তাই ইংরেজি ভাষায় এর গুণগত মান সবচেয়ে ভালো। একই ধরনের বাস্তবতা প্রয়োজনীয় বহুভাষিক প্রকল্পের জন্য, F5-TTS অথবা TextToSpeechAI-এ CosyVoice2 ব্যবহার করুন, যা আরও বেশি ভাষা সমর্থন করে এবং এখনও শব্দের ক্লোনিং প্রদান করে।

টর্টোইজ অসাধারণ, প্রায়শই মানুষের থেকে আলাদা-অডিও তৈরি করে। এটি শ্বাস, দ্বিধা, উচ্চারণ এবং সত্যিকারের আবেগগত প্রতিধ্বনি ধারণ করে যা হালকা মডেলগুলি হারিয়ে ফেলে। এই কারণেই এটি প্রাইম অডিওবুক, চলচ্চিত্র বর্ণনা এবং উচ্চমানের ভয়েসওভার কাজের জন্য একটি প্রিয় হয়ে থাকে যেখানে বাস্তবতা সর্বোচ্চ।

Tortoise সাধারণত গুণগত মান এবং ব্যাচ আকার নির্ভর করে 12-24GB VRAM প্রয়োজন, তাই উচ্চ-শেষ GPUs যেমন RTX 3090, 4090, অথবা A100 স্থানীয় ব্যবহারের জন্য সুপারিশ করা হয়। CPU অনুমান প্রযুক্তিগতভাবে সম্ভব কিন্তু খুব ধীর। TextToSpeechAI এ মডেল আমাদের GPU অবকাঠামোতে চলছে, তাই আপনার নিজের কোন হার্ডওয়্যারের প্রয়োজন নেই।

Tortoise natively renders high-quality 24kHz WAV audio. Through TextToSpeechAI you can request MP3, WAV, or OGG, and we transcode with quality-preserving encoding so you keep the model's fine detail in whatever format your project needs.

Tortoise আল্ট্রা মূল্যের স্তরে প্রতি ১০০০ অক্ষর ৫০ ক্রেডিট, এর গুণগতমান-প্রথম পাইপলাইন ব্যবহার GPU সময় প্রতিফলিত। নতুন অ্যাকাউন্ট বিনামূল্যে শুরুর ক্রেডিট পাবেন, তাই আপনি commit করার আগে Tortoise পরীক্ষা করতে পারেন। আল্ট্রা স্তরে StyleTTS2, OpenVoice, Dia, এবং Zonos অন্তর্ভুক্ত।

উভয়ই আল্ট্রা- টাইর ইঞ্জিন, কিন্তু তারা আলাদাভাবে কাজ করে। Tortoise TTS প্রাকৃতিকতার সর্বোচ্চ শিখরে পৌঁছেছে এবং আবেগগত গভীরতা অর্জন করেছে কিন্তু এটি সবচেয়ে ধীর ইঞ্জিন। StyleTTS2 দ্রুততর প্রজনন সহকারে Tortoise- এর কাছাকাছি গুণমান প্রদান করে, এটিকে অনেকগুলো ক্লিপ বা দ্রুততর পরিবর্তনের প্রয়োজনে একটি ভাল পছন্দ করে তোলে। Tortoise বেছে নিন যখন গুণমানের ব্যাপারে কোন আলোচনা করা যায় না এবং সময় একটি বাধা নয়।

Yes. Sign up on TextToSpeechAI to receive free starter credits, or use the demo on the homepage, and select a Tortoise voice to generate a clip without installing anything. Because Tortoise is slow, start with a short sentence and the "fast" preset to see the quality before running longer jobs.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try Tortoise TTS Now

Generate your first audio free. No credit card required.

Start Free