Tortoise TTS

Ultra

Erittäin korkealaatuinen puhe vertaansa vailla olevalla luonteella

Very Slow Nopeus
Exceptional Laatu
Kyllä Kloonaus
1 Kielet

Tietoja Tortoise TTS

Tortoise TTS on autoregressiivisen tekstin ja äänen välinen malli, joka priorisoi äänen laatua ennen kaikkea. Autoregressiivisten muuntajien ja diffuusiomallien yhdistelmän avulla Tortoise saa aikaan erittäin luonnollista puhetta, joka vangitsee ihmisäänen hienovaraisia vivahteita. Vaikka Tortoise on muita malleja hitaampi, se tuottaa luontevimman TTS:n tuotoksen.

Tärkeimmät ominaisuudet

Erittäin korkea laatu

Luonnollisimmalta kuulostava TTS-tuloste saatavilla.

Äänien kloonaus

Klooniäänet ovat poikkeuksellisen uskollisia ja vivahteikkaita.

Luonnollinen prosody

Kaappaa hienovaraisia puhemalleja ja mikroilmeitä.

Laatupresetit

Valitse ultra_nopeasta korkealaatuiseen käsittelyyn.

Tunnesyvyys

Tuo puheelle aitoa tunneresonanssia.

Avaa lähdekoodi

Apache 2.0, jolla on kaupallinen käyttöoikeus.

Käytä tapauksia

Premium-äänikirjat Elokuvatuotanto Dokumentaarinen narratiivi Ammattilaiset Voiceovers Arkistohankkeet Korkealuokkainen sisältö

Tortoise TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

Miten sitä käytetään Tortoise TTS

  1. 1

    Rekisteröidy tai kokeile ilmaista demoa

    Luo ilmainen TextToSpeechAI-tili starttirahan saamiseksi tai kokeile Tortoisen kotisivun demolla ilman kirjautumista sisään. Tortoise on Ultra-tier moottori (50 krediitiä tuhatta merkkiä kohti), joten ilmaiset krediitit ovat täydelliset ensimmäiseen lyhyeen testiin.

  2. 2

    Valitse Tortoise ja lisää ääni valinnaisesti kloonille

    Valitse Tortoise-ääni ääniselaimesta. Jos haluat kloonata tietyn henkilön, lataa vertailukappale (mieluiten muutama puhdas 5-10 sekunnin näyte) ja Tortoise toistaa tämän äänen suurella uskollisuudella. Muuten valitse yksi sisäänrakennetuista Tortoise-äänistä.

  3. 3

    Syötä teksti

    Kirjoita tai liitä teksti, jonka haluat kertovan. Koska Tortoise on hidas, aloita lyhyellä otteella äänen ja sävelen vahvistamiseksi ennen kuin lähetät täyden äänikirjan luvun tai pitkän käsikirjoituksen.

  4. 4

    Valitse laatu esiaseteltuna ja luo

    Valitse Tortoisen laatuesiasetukset: ultra_nopea pikatesteihin, nopea hyvään nopeuteen/laatutasapainoon (suositeltu oletus), vakioon tai korkeaan laatuun maksimaaliseen realismiin. Klikkaa sitten luo ja ole kärsivällinen - Tortoisella voi kestää 30 sekunnista useisiin minuutteihin per klippi, etenkin korkeammalla presetillä.

  5. 5

    Lataa tai käytä API-rajapintaa

    Kun sukupolvi on valmis, lataa äänesi MP3-, WAV- tai OGG-puhelimeksi tai hae se historiastasi. Voit automatisoida Tortoise-työt soittamalla TextToSpeechAI API:hen ja läpäisemällä valitsemasi laatuasetukset – muista sallia pidemmät aikalisät, koska Tortoise tekee sen hitaasti.

Tortoise TTS API

Luo puheohjelmallisesti TextToSpeechAI REST API:n avulla.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Tortoisella kestää aikansa, mutta tuloksia kannattaa odottaa.",
    "voice": "tortoise-angie"
  }'

Usein kysyttyjä kysymyksiä

Tortoise TTS on James Betkerin luoma, äänen laatua ennen kaikkea priorisoiva autoregressiivisen tekstin ja äänentoiston malli. Siinä yhdistyvät muuntajapohjainen kielimallinnus ja diffuusiodekoodaus, jotta puhe olisi verratonta luontevuutta, tunnesyvyyttä ja ihmismäistä prosodiaa. Sitä pidetään yleisesti yhtenä realistisimmista avoimen lähdekoodin TTS-moottoreista.

Kyllä. Tortoise TTS on avoin lähdekoodi sallivalla Apache 2.0 -lisenssillä, joka mahdollistaa kaupallisen käytön, muokkauksen ja uudelleenjaon. TextToSpeechAI:lla Tortoise istuu Ultra-tasolla 50 krediitillä tuhatta merkkiä kohti raskaiden laskentavaatimustensa ja poikkeuksellisen lähtölaadun vuoksi.

Tortoise on suunnittelultaan hidas: se tuottaa useita ehdokasklipsejä automaattisesti ja hioo sitten parasta diffuusorimallilla ja CLVP:n uudelleenasettautumisvaiheella. Tämä laatu-ensimmäinen putki voi kestää 30 sekunnista useaan minuuttiin tekstin pituudesta ja laadusta riippuen. Vaihtokauppana on, että Tortoisella on jokin TTS-moottorin luonnollisimmista puheista.

Tortoisella on neljä laatunopeutta vaihtavaa ennakkoasetusta: ultra_nopea (~10 x nopeampi, hyvä testaukseen), nopea (~4x nopeampi, tuotannon oletus), vakio (tasapainotettu) ja korkealaatuinen (enimmäislaatu, hitain). Korkeammalla presetit ottavat lisää ehdokkaita ja ajavat enemmän diffuusiovaiheita ennen parhaan tuloksen valintaa. TextToSpeechAI:sta voit valita ennakkoasettelun ennen tuottamista.

Kyllä, Tortoise TTS tukee äänen kloonausta poikkeuksellisen luotettavasti. Tarjoa muutama lyhyt viitekappale kohdeäänestä (mieluiten 3-10 näytettä 5-10 sekuntia) ja Tortoise vangitsee puhujan sävyn, korostuksen, tahdistuksen ja hienovaraiset mikroilmeet. Se on yksi tarkimmista nollalaukaisukoneista, vaikka kloonaus lisää jo pidemmän sukupolven aikaa.

Tortoiselle on opetettu pääasiassa englanninkielisiä puheaineistoja, joten englannin kieli on vahvinta. Monikielisissä projekteissa, jotka tarvitsevat samanlaista realismia, käsitellään F5-TTS:ää tai CosyVoice2:ta TextToSpeechAI:sta, jotka tukevat enemmän kieliä ja tarjoavat silti äänikloonaustaa.

Tortoise tuottaa poikkeuksellista, usein erottamatonta ihmisääntä. Se vangitsee hengitystä, epäröintiä, intonaatiota ja aitoa tunneresonanssia, joita kevyemmät mallit kaipaavat. Siksi se on edelleen suosikki korkealuokkaisissa äänikirjoissa, elokuvakertomuksissa ja korkeatasoisissa äänentoistotöissä, joissa realismi on ensiarvoisen tärkeää.

Tortoise vaatii tyypillisesti 12-24GB VRAM-muistia laatu- ja eräkoosta riippuen, joten huippuluokan GPU:t, kuten RTX 3090, 4090 tai A100, ovat suositeltavia paikalliseen käyttöön. CPU:n päätelmä on teknisesti mahdollinen, mutta erittäin hidas. TextToSpeechAI malli toimii GPU-infrastruktuurissamme, joten omaa laitteistoa ei tarvita.

Tortoise tekee natiivisti korkealaatuista 24kHz WAV -ääntä. TextToSpeechAI:n kautta voi pyytää MP3-, WAV- tai OGG-ääntä, ja me vaihdamme koodia laatua säilyttävällä koodauksella, jotta voit pitää mallin hienot yksityiskohdat missä tahansa muodossa, jota projektisi tarvitsee.

Tortoise on Ultran hinnoittelutasolla 50 krediitillä tuhatta merkkiä kohti, mikä heijastaa GPU:n aikaa, jonka sen laatu-ensimmäinen putki kuluttaa. Uusilla tileillä saa ilmaiset aloitusluotot, joten voit testata Tortoisen ennen sitoutumista. Ultra-lista kattaa myös Styletts2-, OpenVoice-, Dia- ja Zonos-ohjelmat.

Molemmat ovat ultraluokan moottoreita, mutta ne käyvät kauppaa eri tavalla. Tortoise TTS saavuttaa täydellisen luonnollisuuden ja tunnesyvyyden huipun, mutta on ylivoimaisesti hitain moottori. StyleTTS2 tarjoaa lähes Tortoise-laatua paljon nopeammalla sukupolvella, mikä tekee siitä paremman valinnan, kun tarvitaan monta klikkausta tai nopeampaa käännettä. Valitse Tortoise, kun laatu ei ole neuvoteltavissa eikä aika ole rajoite.

Kyllä. Rekisteröidy TextToSpeechAI:ssa saadaksesi ilmaisen aloituskomennuksen, tai käytä demoa kotisivulla ja valitse Tortoise-ääni luodaksesi klipin asentamatta mitään. Koska Tortoise on hidas, aloita lyhyellä lauseella ja "nopealla" esiasetuksella, jotta näet laadun ennen kuin teet pidempiä töitä.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try Tortoise TTS Now

Generate your first audio free. No credit card required.

Start Free