Tortoise TTS

Ultra

Ultra-High Quality ræða með óviðjafnanlegu náttúruleika

Very Slow Hraði
Exceptional Gæði
Klóna
1 Tungumál

Um Tortoise TTS

s available. Tortoise TTS is a

Lykilatriði

Mjög há gæði

The eðlilega hljómandi TTS framleiðsla í boði.

Raddklóðun

Klóna raddir með óvenjulegum trúmennsku og blæbrigðum.

Náttúruleg orðræða

Handtaka lúmskur talmynstur og ör-tjáning.

Forstillingar gæða

Veldu úr ultra_fast til high_quality vinnslu.

Emotional dýpt

Býr til ræðu með ósvikinn tilfinningalega resonance.

Opinn kóði

Apache 2.0 leyfi með viðskiptalegum notkunarréttindum.

Nota tilfelli

Premium hljóðbækur Kvikmyndaframleiðsla Documentary frásögn Professional Voiceovers Skráarsafnsverkefni Hágæða efni

Tortoise TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

Hvernig á að nota Tortoise TTS

  1. 1

    Skráðu þig eða prófaðu ókeypis kynninguna

    Búðu til ókeypis TextToSpeechAI reikning til að fá byrjunarpunkta, eða notaðu heimasíðuna til að reyna Tortoise án þess að skrá þig inn. Tortoise er Ultra-tier vél (50 einingar á 1000 stafi), þannig að ókeypis einingar eru fullkomin fyrir fyrsta stutta próf.

  2. 2

    Veldu Tortoise og valfrjálst að bæta við rödd til að klóna

    Veldu Tortoise rödd úr raddvafranum. Til að klóna tiltekna manneskju skaltu hlaða inn tilvísunarmyndbandi (helst nokkrum 5- 10 sekúndna sýnishornum) og Tortoise mun endurskapa röddina með mikilli nákvæmni. Annars skaltu velja eina af innbyggðu Tortoise röddunum.

  3. 3

    Sláðu inn textann þinn

    Sláðu inn eða límdu textann sem þú vilt að sé sagt. Þar sem Tortoise er hægur, byrjaðu með stuttum kafla til að staðfesta rödd og tónn áður en þú sendir heilan kafla hljóðbókar eða langt handrit.

  4. 4

    Veldu gæði forstillingar og búa til

    Veldu Tortoise gæði forstillingu: ultra_fast fyrir fljótur próf, fljótur fyrir góða hraða / gæði jafnvægi (mælt sjálfgefið), staðall, eða high_quality fyrir hámarks raunsæi. Smelltu síðan á búa til og vera þolinmóður - Tortoise getur tekið frá 30 sekúndur til nokkrar mínútur á klipp, sérstaklega á hærri forstillingar.

  5. 5

    Hlaða niður eða nota API

    Þegar framleiðslu lýkur skaltu sækja hljóðskrána sem MP3, WAV eða OGG, eða sækja hana úr sögunni þinni. Til að gera Tortoise sjálfvirkt skaltu hringja í TextToSpeechAI API og senda gæði sem þú hefur valið - mundu að leyfa lengri tímabil þar sem Tortoise gerir hægt.

Tortoise TTS API

Búa til ræðu forritunarlega með TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Turtoise tekur sinn tíma, en niðurstöður eru þess virði að bíða eftir.",
    "voice": "tortoise-angie"
  }'

Algengar spurningar

Tortoise TTS er sjálfvirkt texta-til-tal líkan búið til af James Betker sem forgangsraðar hljóðgæðum umfram allt annað. Það sameinar spennu sem byggist á tungumálslíkanum með dreifingar afkóðunar til að búa til tal með óviðjafnanlegri náttúruleika, tilfinningalegri dýpt og mannlegum eins og prósódíum. Það er víða talið vera einn af raunsæustu opnum TTS vélum sem til eru.

Já. Tortoise TTS er opinn uppspretta undir leyfilegum Apache 2.0 leyfi, sem leyfir viðskiptalega notkun, breytingar og endurdreifingu. Á TextToSpeechAI, Tortoise situr í Ultra stigi á 50 credits á 1000 stafi vegna mikillar tölvukröfur og framúrskarandi framleiðsla gæði.

Tortoise er hægur í hönnun: hann býr til nokkra mögulega klippinga sjálfkrafa og fínstillir síðan besta klippinginn með dreifingarlíkani og CLVP endurröðunarskref. Þessi gæði-fyrst leiðsla þýðir að einn klipp getur tekið frá 30 sekúndum til nokkurra mínútna eftir lengd textans og forstilltu gæðum. Það sem skiptir máli er að Tortoise framleiðir eðlilegasta tal allra TTS véla.

Tortoise býður upp á fjögur forstillingar sem skipta hraða fyrir gæði: ultra_fast (~10x hraðar, gott til prófunar), fast (~4x hraðar, framleiðslu sjálfgefið), standard (jafnvægi) og high_quality (hágæða, hægasta). Hærri forstillingar sýna fleiri möguleika og keyra fleiri dreifingarstig áður en valið er besta niðurstaðan. Á TextToSpeechAI getur þú valið forstillingu áður en búið er til.

Já, Tortoise TTS styður raddklónun með einstakri nákvæmni. Gefðu nokkrar stuttar tilvísunarmyndbönd af markröddinni (helst 3-10 sýni á 5-10 sekúndum hvert) og Tortoise tekur timbrið, hreim, hraða og fíngert ör-tjáning hátalara. Það er einn af nákvæmustu núll-skot klónun vélum, þótt klónun bætir við þegar-langur kynslóðartími.

Tortoise var fyrst og fremst þjálfaður á enskum talgagnagrunni, þannig að enska er þar sem gæði hans eru sterkust. Fyrir fjöltyng verkefni sem þurfa svipaða raunsæi, íhuga F5-TTS eða CosyVoice2 á TextToSpeechAI, sem styðja fleiri tungumál en bjóða enn raddklónun.

Tortoise framleiðir óvenjulegt, oft ógreinanlegt frá mannlegu hljóði. Það tekur öndun, hiksta, innslátt og ósvikinn tilfinningalega ómun sem léttari gerðir missa af.Þetta er ástæðan fyrir því að það er enn uppáhalds fyrir hágæða hljóðbækur, kvikmyndasögu og hágæða rödd þar sem raunsæi er mikilvægt.

Tortoise þarf venjulega 12-24GB af VRAM eftir því hvaða gæði eru fyrirframstillt og stærð lotu, þannig að mælt er með hágæða GPU eins og RTX 3090, 4090 eða A100 fyrir staðbundna notkun. CPU ályktun er tæknilega mögulegt en mjög hægur. Á TextToSpeechAI keyrir líkanið á GPU innviði okkar, þannig að þú þarft ekki neinn vélbúnað sjálfur.

Með TextToSpeechAI geturðu óskað eftir MP3, WAV eða OGG og við transcode með gæðavörn kóðunar þannig að þú heldur fínum smáatriðum líkansins í hvaða sniði sem verkefnið þitt þarfnast.

Tortoise er í Ultra verðlagningu stigi á 50 einingar á 1000 stafi, endurspeglar GPU tíma þess gæði-fyrst pípa neytir. Nýir reikningar fá ókeypis byrjun einingar, svo þú getur prófað Tortoise áður en skuldbinda. Ultra tier nær einnig StyleTTS2, OpenVoice, Dia, og Zonos.

Báðir eru Ultra-tier vélar, en þeir versla á annan hátt. Tortoise TTS nær algerlega hápunkti náttúruleika og tilfinningalega dýpt en er langt hægari vél. StyleTTS2 skilar nálægt-Tortoise gæði með miklu hraðari kynslóð, sem gerir það betri val þegar þú þarft mörg hreyfimyndir eða hraðari snúning. Pick Tortoise þegar gæði er ekki samningaviðræður og tími er ekki takmörkun.

Já. Skráðu þig á TextToSpeechAI til að fá ókeypis byrjunarpunkta, eða notaðu sýnishornið á heimasíðunni og veldu Tortoise rödd til að búa til myndskeið án þess að setja neitt upp. Þar sem Tortoise er hægur, byrjaðu með stuttri setningu og "hraðvirkri" forstillingu til að sjá gæði áður en þú keyrir lengri verk.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try Tortoise TTS Now

Generate your first audio free. No credit card required.

Start Free