Tortoise TTS

Ultra

Pidato Kualitas Ultra-High dengan Alami yang Tak tertandingi

Very Slow Kecepatan
Exceptional Kualitas
Ya Kloning
1 Bahasa

Tentang Tortoise TTS

Tortoise TTS adalah model autoregressive teks-to-peech yang memprioritaskan kualitas audio di atas segalanya. menggunakan kombinasi dari model transformator autoregressive dan difusi, Tortoise menghasilkan pidato yang sangat alami yang menangkap nuansa halus suara manusia. Sementara lebih lambat dari model lain, Tortoise menghasilkan keluaran TTS yang paling terdengar alami.

Fitur Kunci

Kualitas Tinggi Ultra

Keluaran paling alami yang terdengar TTS tersedia.

Penuturan Suara

Suara klon dengan kesetiaan yang luar biasa dan nuansa.

Prosody Alami

Menangkap pola bicara halus dan ekspresi mikro.

Kualitas Preset

Pilih dari ultra_cepat ke pemrosesan kualitas tinggi.

Kedalaman Emosi

Hasilkan pidato dengan resonansi emosional asli.

Sumber Terbuka

Apache 2.0 berlisensi dengan hak penggunaan komersial.

Gunakan Kasus

Buku Audio Premium Produksi Film Narasi Dokumenter Voiceovers Profesional Proyek Archival Isi Akhir-Tinggi

Tortoise TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

Cara Menggunakan Tortoise TTS

  1. 1

    Daftar atau coba demo gratis

    Create a free TextToSpeechAI account to get starter credits, or use the homepage demo to try Tortoise without signing in. Tortoise is an Ultra-tier engine (50 credits per 1000 characters), so the free credits are perfect for a first short test.

  2. 2

    Pilih Tortoise dan tambahkan suara ke klon

    Pilih sebuah suara Tortoise dari peramban suara. Untuk mengkloning orang tertentu, unggah sebuah klip referensi (sebagian dari 5-10 detik bersih) dan Tortoise akan mereproduksi suara itu dengan kesetiaan yang tinggi. Sebaliknya, pilih salah satu suara Tortoise yang dibangun.

  3. 3

    Masukkan teks Anda

    Ketik atau tempelkan teks yang ingin Anda narrated. Karena Tortoise lambat, mulai dengan bagian pendek untuk mengkonfirmasi suara dan nada sebelum mengirim bab audio atau skrip panjang.

  4. 4

    Pilih preset kualitas dan hasilkan

    Pilih preset kualitas Tortoise: ultra_fast untuk tes cepat, cepat untuk keseimbangan kecepatan/setara (disarankan default), standar, atau kualitas tinggi untuk realisme maksimum. Kemudian klik hasilkan dan bersabar - Tortoise dapat mengambil dari 30 detik ke beberapa menit per klip, terutama pada preset yang lebih tinggi.

  5. 5

    Unduh atau gunakan API

    When generation finishes, download your audio as MP3, WAV, or OGG, or fetch it from your history. To automate Tortoise jobs, call the TextToSpeechAI API and pass your chosen quality preset - remember to allow longer timeouts since Tortoise renders slowly.

Tortoise TTS API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kura\u002Dkura membutuhkan waktu, tapi hasilnya layak ditunggu.",
    "voice": "tortoise-angie"
  }'

Pertanyaan yang Sering Diajukan

Tortoise TTS adalah sebuah model autoregressive teks-to-peech yang dibuat oleh James Betker yang memprioritaskan kualitas audio di atas segalanya. Ini merupakan model berbasis transformer dengan decoding difusi untuk menghasilkan pidato dengan kealamian yang tidak tertandingi, kedalaman emosi, dan manusia-seperti prosody. Hal ini secara luas dianggap sebagai salah satu mesin TTS open-source yang paling realistis tersedia.

Yes. Tortoise TTS is open-source under the permissive Apache 2.0 license, which allows commercial use, modification, and redistribution. On TextToSpeechAI, Tortoise sits in the Ultra tier at 50 credits per 1000 characters because of its heavy compute requirements and exceptional output quality.

Tortoise lambat dirancang: ini menghasilkan beberapa kandidat klip otomatis dan kemudian memperbaiki yang terbaik dengan model difusi dan langkah yang dipangkatkan CLVP. Barisan pertama kualitas ini berarti klip tunggal dapat mengambil dari 30 detik tergantung pada teks dan kualitas preset.

Tortoise offers four presets that trade speed for quality: ultra_fast (~10x faster, good for testing), fast (~4x faster, the production default), standard (balanced), and high_quality (maximum quality, slowest). Higher presets sample more candidates and run more diffusion steps before selecting the best result. On TextToSpeechAI you can pick a preset before generating.

Ya, Tortoise TTS mendukung kloning suara dengan kesetiaan yang luar biasa. Menyediakan beberapa klip referensi pendek dari suara target (sebagian besar 3-10 contoh 5-10 detik masing-masing), dan Tortoise menangkap timbre pembicara, aksen, jarak, dan ekspresi mikro halus. Ini adalah salah satu mesin kloning yang paling akurat, meskipun kloning ditambahkan ke waktu yang sudah lama.

Tortoise was trained primarily on English speech datasets, so English is where its quality is strongest. For multilingual projects that need similar realism, consider F5-TTS or CosyVoice2 on TextToSpeechAI, which support more languages while still offering voice cloning.

Tortoise menghasilkan audio yang luar biasa, seringkali tidak dapat dibedakan dari manusia. menangkap pernapasan, keragu-raguan, intonasi, dan resonansi emosional asli yang hilang dari model ringan. inilah sebabnya mengapa hal ini tetap menjadi favorit untuk buku audio premium, narasi film, dan suara akhir tinggi bekerja di mana realisme adalah yang terpenting.

Tortoise typically requires 12-24GB of VRAM depending on the quality preset and batch size, so high-end GPUs like the RTX 3090, 4090, or A100 are recommended for local use. CPU inference is technically possible but extremely slow. On TextToSpeechAI the model runs on our GPU infrastructure, so you do not need any hardware of your own.

Tortoise natively renders high-quality 24kHz WAV audio. Through TextToSpeechAI you can request MP3, WAV, or OGG, and we transcode with quality-preserving encoding so you keep the model's fine detail in whatever format your project needs.

Tortoise berada di tingkat harga Ultra 50 kredit per 1000 karakter, mencerminkan waktu GPU yang berkualitas-pertama pipa mengkonsumsi akun baru mendapatkan kredit starter gratis, sehingga Anda dapat menguji Tortoise sebelum melakukan.

Keduanya adalah mesin Ultra-tier, tetapi mereka saling bertukar dengan berbeda. menjadi pilihan yang lebih baik ketika Anda membutuhkan banyak klip atau lebih cepat berputar.

Yes. Sign up on TextToSpeechAI to receive free starter credits, or use the demo on the homepage, and select a Tortoise voice to generate a clip without installing anything. Because Tortoise is slow, start with a short sentence and the "fast" preset to see the quality before running longer jobs.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try Tortoise TTS Now

Generate your first audio free. No credit card required.

Start Free