Tortoise TTS

Ultra

Ultra-kõrge kvaliteediga kõne tasakaalustamata Naturalness

Very Slow Kiirus
Exceptional Kvaliteet
Jah Kloonimine
1 Keeled

Info Tortoise TTS

Tortoise TTS on automaatne regressiivne teksti-kõne mudel, mis eelistab eelkõige helikvaliteeti. Kasutades autoregressiivsete trafode ja difusioonimudelite kombinatsiooni, tekitab Tortoise äärmiselt loomuliku kõne, mis haarab inimese hääle peenikesi nüansse. Kuigi aeglasemalt kui teised mudelid, toodab Tortoise kõige loomulikum kõlav TTS väljund saadaval.

Peamised omadused

Ultra-kõrge kvaliteet

Kõige loomulikum kõlav TTS väljund saadaval.

Hääle kloonimine

Kloonhääled erakordse truuduse ja nüansiga.

Natural Prosody

Pildistab peeneid kõnemustreid ja mikroväljendusi.

Kvaliteetsed seaded

Valige alates ultra_kiirest kuni kvaliteetse töötlemiseni.

Emotsionaalne sügavus

Loob kõne tõelise emotsionaalse resonantsiga.

Avatud lähtekoodiga

Apache 2.0 litsentsitud kaubandusliku kasutusõigusega.

Kasutusklassid

Premium audioraamatud Filmitootmine Dokumentaalarhitektuur Professional Voiceovers Arhiiviprojektid Kõrge lõpuga sisu

Tortoise TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

Kuidas kasutada Tortoise TTS

  1. 1

    Registreeru või proovi tasuta demo

    Loo tasuta TextToSpeechAI konto saada starter krediiti, või kasutada kodulehe demo proovida Tortoise ilma allkirjastamata sisse. Tortoise on Ultra-tier mootor (50 krediiti 1000 tähemärki), nii et tasuta krediiti on ideaalne esimene lühike test.

  2. 2

    Vali Tortoise ja lisa valikuliselt hääl klooni

    Vali häälelehitsejalt Tortoise hääl. Konkreetse isiku kloonimiseks laadige üles viiteklipp (ideaaljuhul mõned puhtad 5-10 teise näidise näidised) ja Tortoise taastab selle hääle suure truudusega. Vastasel juhul valige mõni sisseehitatud Tortoise hääl.

  3. 3

    Sisesta oma tekst

    Kirjuta või aseta tekst, mida soovid jutustada. Kuna Tortoise on aeglane, alusta lühikese käiguga, et kinnitada häält ja tooni, enne kui saadad täieliku audioraamatu peatüki või pika skripti.

  4. 4

    Valige kvaliteet valmisseadistatud ja genereerida

    Vali Tortoise kvaliteedi eelseadistus: ultra_ kiireks testimiseks, kiireks hea kiiruse ja kvaliteedi tasakaalu (soovitatav vaikimisi), standard, või kõrge_ kvaliteet maksimaalne realism. Seejärel klõpsake genereerida ja kannatlik - Tortoise võib võtta 30 sekundit kuni mitu minutit klipp, eriti kõrgemates valmisseadistustes.

  5. 5

    API allalaadimine või kasutamine

    Kui generatsioon lõpetab, alla laadida oma audio MP3, WAV, või OGG, või tõmmata see oma ajaloost. Et automatiseerida Tortoise töökohti, helista TextToSpeechAI API ja läbida oma valitud kvaliteediga eelseadistatud - pidage meeles, et võimaldada pikema aja mahajätmist alates Tortoise muudab aeglaselt.

Tortoise TTS API

Loo kõne programmiliselt kasutades TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Tortoise võtab aega, kuid tulemused on ootamist väärt.",
    "voice": "tortoise-angie"
  }'

Korduma kippuvad küsimused

Tortoise TTS on James Betkeri loodud automaatne regressiivne teksti-kõne mudel, mis eelistab eelkõige audiokvaliteeti. See ühendab trafopõhise keelemudeli difusiooni dekodeerimisega, et tekitada kõnes tasakaalustamata naturaalsust, emotsionaalset sügavust ja inimlikku prosoodiat. Seda peetakse üldiselt üheks kõige realistlikumaks avatud lähtekoodiga TTS mootoriks.

Jah. Tortoise TTS on avatud lähtekoodiga alusel lubatud Apache 2.0 litsentsi, mis võimaldab äriotstarbelise kasutamise, muutmise ja ümberjaotamise. TextToSpeechAI, Tortoise istub Ultra tase 50 krediiti 1000 tähemärki, sest tema raske arvutusnõuded ja erakordse toodangu kvaliteedi.

Tortoise on disainilt aeglane: see tekitab mitmeid kandidaatklippe autoregressiivselt ja seejärel täiustab parimat difusioonimudeliga ja CLVP uuesti järjestamise sammuga. See kvaliteedi esimene torujuhe tähendab, et üks klipp võib kesta 30 sekundit kuni mitu minutit, sõltuvalt teksti pikkusest ja kvaliteedist. Kompromiss on see, et Tortoise toodab iga TTS mootori kõige loomulikumat kõnet.

Tortoise pakub nelja presets, et kaubanduse kiirus kvaliteedi: ultra_kiire (~10x kiirem, hea testimiseks), kiire (~4x kiiremini, tootmise vaikimisi), standard (tasakaalustatud) ja kõrge_kvaliteet (maksimaalne kvaliteet, aeglaseim). Kõrgem presets proovi rohkem kandidaate ja käivitada rohkem difusiooni samme enne valides parim tulemus. TextToSpeechAI saate valida eelseadistatud enne genereerimist.

Jah, Tortoise TTS toetab hääl kloonimist erakordse truudusega. Anna paar lühikest viiteklippi sihthäälest (ideaaljuhul 3-10 näidist 5-10 sekundit) ja Tortoise tabab kõneleja timbre, aktsendi, patseerimise ja peene mikroekspressiooni. See on üks täpsemaid nullvõttega kloonimise mootoreid, kuigi kloonimine lisab juba pikale põlvkonnale.

Tortoise treeniti peamiselt inglise kõnede andmekogumites, nii et inglise keel on kõige parem. Mitmekeelsete projektide puhul, mis vajavad samasugust realismi, mõelge F5-TTS või CosyVoice2 kohta TextToSpeechAI, mis toetavad rohkem keeli, pakkudes samal ajal veel hääl kloonimine.

Tortoise toodab erakordset, sageli eristamatut heli inimeselt. See haarab hingamist, kõhklusi, intonatsiooni ja ehtsat emotsionaalset resonantsi, mida kergemad mudelid vahele jätavad. Seepärast on see jätkuvalt lemmik premium-heliraamatute, filmi jutustamise ja kõrgtasemel kõlaritöö jaoks, kus realism on ülimalt tähtis.

Tortoise tavaliselt nõuab 12-24GB VRAM sõltuvalt kvaliteedist eelseadistatud ja partii suurus, nii high-end GPUs nagu RTX 3090, 4090, või A100 soovitatakse kohalikuks kasutamiseks. CPU järeldus on tehniliselt võimalik, kuid väga aeglane. Sisse TextToSpeechAI mudel töötab meie GPU infrastruktuuri, nii et sa ei vaja mingit riistvara oma.

Tortoise emakeelena muudab kvaliteetse 24kHz WAV audio. Läbi TextToSpeechAI saate taotleda MP3, WAV, või OGG, ja me transcode kvaliteedi säilitamise kodeering nii hoiate mudeli peen detail mis tahes formaadis oma projekti vajadustele.

Tortoise on Ultra hinnatasemel 50 krediiti 1000 tähemärgi kohta, peegeldades GPU aega oma kvaliteedi esimene torujuhe tarbib. Uued kontod saavad tasuta starter krediiti, nii et saate testida Tortoise enne kohustuse võtmist. Ultra tase hõlmab ka StyleTTS2, OpenVoice, Dia, ja Zonos.

Mõlemad on Ultra-tier mootorid, kuid nad kauplevad erinevalt. Tortoise TTS jõuab absoluutse tippu loomulikkus ja emotsionaalne sügavus, kuid on kaugelt aeglaseim mootor. StyleTTS2 pakub lähedal Tortoise kvaliteedi palju kiiremini põlvkonna, muutes parema valiku, kui vajate palju klips või kiirem pöörlemine. Pick Tortoise kui kvaliteet ei ole kaubeldav ja aeg ei ole piirang.

Jah. Registreeru TextToSpeechAI saada tasuta starter krediiti, või kasutada demo kodulehel, ja vali Tortoise hääl luua klipp ilma installimist midagi. Kuna Tortoise on aeglane, alustada lühikese lause ja "kiire" valmis näha kvaliteeti enne töötab kauem töökohti.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try Tortoise TTS Now

Generate your first audio free. No credit card required.

Start Free