Tortoise TTS

Ultra

Govor Ultra visoke kakovosti z neusklajeno naravo

Very Slow Hitrost
Exceptional Kakovost
-Da. Kloniranje
1 Jeziki

O projektu Tortoise TTS

Tortoise TTS je avtoregresiven model besedila-na-špik, ki prednostno prednostno kakovost zvoka nad vse. Z kombinacijo avtoregresivnih transformatorjev in difuzijskih modelov Tortoise ustvarja izredno naravno govor, ki zajema prefinjene nuanse človeškega glasu. Tortoise proizvaja najbolj naravno-zvočni izhod TTS, ki je na voljo.

Ključne lastnosti

Ultra- visokokakovost

Najnaravnejša TTS izhodna na voljo.

Kloniranje glasu

Klonirat glasove z izjemno zvestobo in nuanso.

Naravna prozodija

Zajema prefinjene vzorce govora in mikro-izražanja.

Predpostavke kakovosti

Izberite od ultra_hitra do visokokakovostne obdelave.

Čustvena globina

Ustvari govor z resnično čustveno rezonanco.

Odpri vir

Apači 2.0 licencirano s komercialnimi pravicami do uporabe.

Uporabne primere

Prednostne zvočne knjige Filmska produkcija Dokumentarna razprava Profesionalni recenziji Arhivalni projekti Visokokončna vsebina

Tortoise TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

Kako uporabljati Tortoise TTS

  1. 1

    Prijavite se ali poskusite brezplačno demo

    Ustvarite brezplačno TextToSpeechAI račun za pridobitev zagonskih kreditov, ali uporabite naslovno demo za poskus Tortoise brez prijave v. Tortoise je Ultra-tier motor (50 kreditov na 1000 znakov), tako da so brezplačni krediti so popolni za prvi kratek test.

  2. 2

    Izberite Tortoise in dodate glas k klonu

    Izberite glas Tortoise iz glasnega brskalnika. Za kloniranje določene osebe, naložite referenčni klip (idealno nekaj čistih 5-10 sekund vzorcev) in Tortoise bo ta glas reproducirala z visoko zvestobo. Drugače izberite enega od vgrajenih Tortoise glasov.

  3. 3

    Vnesite svoje besedilo

    Vpišite ali vlepite besedilo, ki ga želite narati. Ker je Tortoise počasen, začnite s kratkim prehodom, da potrdite glas in ton, preden pošljete polno poglavje zvočnike ali dolgo skripto.

  4. 4

    Izberite kakovostno nastavitev in ustvarite

    Izberite predpostavko kakovosti Tortoise: ultra_hiter za hitre teste, hitro za dobro hitrost/ravnotežje kakovosti (priporočeno privzeto), standard ali visoko_kakovost za največji realizem. Nato kliknite generirajte in bodite potrpežljivi - Tortoise lahko traja od 30 sekund do več minut na posnetek, zlasti pri višjih predpostavkah.

  5. 5

    Prenesi ali uporabi API

    Ko generacija konča, prenesete svoj zvok kot MP3, WAV ali OGG ali ga iz vaše zgodovine izvleči. Za avtomatizacijo Tortoise opravila, pokličite TextToSpeechAI API in prenesite izbrano kakovostno nastavitev - ne pozabite dovoliti daljše časovne zaporedje, saj Tortoise izdeluje počasi.

Tortoise TTS API

Ustvarite govor programsko z uporabo TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Tortoise potrebuje čas, vendar so rezultati vredni čakanja.",
    "voice": "tortoise-angie"
  }'

Pogosta vprašanja

Tortoise TTS je avtoregresiven tekst-to-peech model, ki ga je ustvaril James Betker, ki prednostno določa kakovost avdio pred vsem drugim. Združuje transformatorsko-na osnovi jezikovnega modeliranja z difuzijo dekodiranje za ustvarjanje govora z neuspelo naravo, čustveno globino in človeško-podobno prozodijo. Široma velja za enega od najbolj realnih motorjev TTS, ki so na voljo odprtega vira.

Da. Tortoise TTS je odprt vir pod permissionive Apache 2.0 licenco, ki omogoča komercialno uporabo, spremembo in prerazporeditev. Na TextToSpeechAI, Tortoise sedi v Ultra vrsti po 50 kreditov na 1000 znakov zaradi svojih zahtev za težke izračuna in izjemne kakovosti izhoda.

Tortoise je počasen z zasnovo: ustvarja več kandidatskih klipov avtoregresivno in nato izboljšuje najboljše z difuzijskim modelom in korakom ponovnega rankinga CTVP. Ta kakovostni prvi plinovod pomeni, da lahko en posnetek traja od 30 sekund do več minut glede na dolžino besedila in kakovost nastavljene. Tortoise je, da proizvaja nekaj najbolj naravnega govora katerega koli TTS motorja.

Tortoise ponuja štiri prednastavke, ki trgovanje hitrost za kakovost: ultra_hitrejši (~10x, dobri za testiranje), hitri (~4x hitrejši, proizvodni privzeti), standard (ravnotežen), in visoko_kakovost (največja kakovost, počasnejši). Višje nastavitve vzorec več kandidatov in teči več difuzijskih korakov, preden izberete najboljši rezultat. Na TextToSpeechAI lahko izberete nastavljeno pred ustvarjanjem.

Da, Tortoise TTS podpira kloniranje glasu z izjemno zvestobo. Zagotovite nekaj kratkih referenčnih posnetkov ciljnega glasu (po 3-10 vzorcev po 5-10 sekund vsak), in Tortoise zajame zvočnikov timbre, naglas, pacing in subtilne mikro-izražanja. Je eden od najbolj natančnih ničnih kloniranja motorjev, čeprav kloniranje dodaja že dolgotrajno generacijo časa.

Tortoise je bil izurjen predvsem na angleških zbirkah podatkov govora, zato je angleščina je njena kakovost najmočnejši. Za večjezične projekte, ki potrebujejo podoben realizem, razmislite F5-TTS ali CosyVoice2 na TextToSpeechAI, ki podpirajo več jezikov, medtem ko še vedno ponujajo kloniranje glasu.

Tortoise proizvaja izjemno, pogosto nerazločno-od-človekovega avdio. Zajema dihanje, oklevanje, intonacijo in resnično čustveno rezonanciranje, ki ga vžigajo vnetljivi modeli. Zato je še vedno najljubša za premium audio knjige, filmske naracije in visoko-glasovno delo, kjer je realizem najpomembnejši.

Tortoise običajno zahteva 12-24GB VRAM odvisno od kakovosti prednastavljene in velikosti serije, tako visoko končni GPUs kot RTX 3090, 4090 ali A100 so priporočljivi za lokalno uporabo. Preverjanje CPU je tehnično mogoče, vendar izredno počasen. Na TextToSpeechAI model teče na naši GPU infrastrukturi, tako da ne potrebujete nobene lastne strojne opreme.

Tortoise naravno izdeluje visokokakovostni zvočni zvok 24kHz WAV. K TextToSpeechAI lahko zahtevate MP3, WAV ali OGGG, in transkodiramo s kakovostno-varovanje kodiranja, tako da obdržite model je v redu podrobnosti v katerikoli obliki, ki ga vaš projekt potrebuje.

Tortoise je v Ultra cenovni stopnji na 50 kreditov na 1000 znakov, odražajoč čas GPU prvo kakovostno porabo plinovoda. Novi računi dobijo brezplačno zagonske kredite, tako da lahko testirajo Tortoise pred prevzemom. Ultra stopnja zajema tudi StyleTTS2, OpenVoice, Dia, in Zonos.

Oba sta Ultra-tier motorji, vendar se trgovajo drugače. Tortoise TTS dosega absolutno vrh narave in čustveno globino, vendar je daleč najbolj počasen motor. StyleTTS2 zagotavlja bližnji-Tortoise kakovost z veliko hitrejšo generacijo, da je boljša izbira, ko potrebujete veliko klipov ali hitrejše obrambe. Izberite Tortoise, ko kakovost ni pregovorljivo in čas ni omejevanje.

Da. Pridružite se TextToSpeechAI za prejemanje brezplačnih zagonskih kreditov, ali uporabite demo na spletni strani, in izberite Tortoise glas za ustvarjanje klipa brez namestitve ničesar. Ker je Tortoise počasen, začnite z kratkim stavkom in "hitro" nastavitev, da vidite kakovost, preden se zažene daljše delovne mesto.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try Tortoise TTS Now

Generate your first audio free. No credit card required.

Start Free