Tortoise TTS

Ultra

Ավելի բարձր որակով խոսակցություն՝ անչափ բնականությամբ

Very Slow արագություն
Exceptional Գործողություն
Այո Կլոնավորում
1 Լեզուներ

Ընդհանուր Tortoise TTS

s available. Tortoise TTS is a

Կարգավորումներ

Ավելի բարձր որակ

TTS-ի բնական ձայնով ելքը։

Ձայնի կլոնավորում

Կլոնավորել ձայները բացառիկ հավատարմությամբ և նյուաններով։

Ճշմարիտ

Գրանցում է խոսակցության մանրամասն օրինակները և միկրո արտահայտությունները։

Առաջինական որակ

Ընտրեք ultra_fast-ից մինչև high_quality-ի միջև։

Էմոցիաների խորությունը

Ծագեցնում է խոսքը իրական զգացմունքային ռեզոնանսով։

Առանց կոդ

Apache 2.0-ը վավերացվել է առևտրային օգտագործման իրավունքներով։

Օգտագործման դեպքեր

Premium ձայնագրություններ Ֆիլմերի արտադրություն Դիտարկման ցուցակ Պրոֆեսիոնալ ձայնագրություն Արխիվային նախագծեր Հնարավոր է

Tortoise TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

Ինչպես օգտագործել Tortoise TTS

  1. 1

    Գրանցվել կամ փորձել անվճար ցուցադրական տարբերակը

    Կերեք անվճար TextToSpeechAI հաշիվ՝ ստանալով սկզբնական վարկային գումարներ, կամ օգտագործեք Tortoise-ի ցուցադրական էջը՝ փորձելու համար առանց գրանցվելու։ Tortoise-ը Ultra-tier ռեժիմով սարքն է (50 վարկային գումար յուրաքանչյուր 1000 այբուբենի համար), այսինքն՝ անվճար վարկային գումարները առաջին կարճ փորձարկման համար կատարյալ են։

  2. 2

    Ընտրեք Tortoise- ը և ընտրյալ ավելացրեք ձայնը կլոնոյի համար

    Ընտրեք Tortoise ձայնը ձայնային զննարկիչից։ Որոշված մարդու կլոնավորելու համար ներբեռնեք հղման կտոր (հատկապես 5-10 վայրկյան տևողությամբ մի քանի օրինակ) և Tortoise-ը կպատկերացնի այդ ձայնը բարձր հավատարմությամբ։ Այլ դեպքում ընտրեք Tortoise-ի ներկառուցված ձայներից մեկը։

  3. 3

    Տեղադրել ձեր տեքստ

    Տպեք կամ կպցրեք այն տեքստերը, որոնք ցանկանում եք լսել։ Քանի որ Tortoise- ն դանդաղ է, սկսեք կարճ հատվածով՝ հաստատելու համար ձայնը և տոնը, մինչև ամբողջական ձայնագրության գլուխ կամ երկար սցենար ուղարկելը։

  4. 4

    Ընտրեք որակի նախնական սահմանումը և ստեղծեք

    Ընտրեք Tortoise-ի որակի նախնական սահմանումը. ultra_fast արագ թեստերի համար, fast արագության/կարողությունների լավ հավասարակշռության համար (պահպանված է նախնական սահմանումը), standard կամ high_quality առավելագույն իրականության համար։ Այնուհետև սեղմեք գեներացնել և համբերեք՝ Tortoise-ը կարող է 30 վայրկյանից մինչև մի քանի րոպե տևել յուրաքանչյուր կադրի համար, հատկապես ավելի բարձր նախնական սահմանումների դեպքում։

  5. 5

    Բեռնել կամ օգտագործել API

    Երբ ստեղծումը ավարտվի, ներբեռնեք ձեր ձայնը MP3, WAV կամ OGG ձևաչափով կամ վերցրեք այն ձեր պատմությունից։ Tortoise- ի աշխատանքները ավտոմատացնելու համար, զանգահարեք TextToSpeechAI API- ին և փոխանցեք ձեր ընտրած որակի նախնական դասավորությունը։ Հիշեք թույլ տալ երկար ժամանակահատվածներ, քանի որ Tortoise- ը դանդաղ է ցուցադրում։

Tortoise TTS API

Ծրագրային ապահովման միջոցով խոսակցության ստեղծում TextToSpeechAI REST API-ի միջոցով։

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Կղզու համար ժամանակ է պետք, բայց արդյունքները սպասելին արժանի են։",
    "voice": "tortoise-angie"
  }'

Հաճախակի տրվող հարցեր

Tortoise TTS- ը Ջեյմս Բեթքերի կողմից ստեղծված ինքնակենսագրական տեքստը խոսքի վերածելու մոդել է, որը ձայնային որակը առաջնահերթություն է տալիս բոլորից առաջ։ Այն համադրում է թրենդերի վրա հիմնված լեզվի մոդելավորումը և ճառագայթման կոդավորումը, որպեսզի ստեղծի խոսք՝ անչափ բնական, զգացմունքային խորությամբ և մարդկային պես ձայնով։ Այն համարվում է բաց կոդով TTS- ի ամենառացիոնալ մոդելներից մեկը։

Այո։ Tortoise TTS-ը բաց կոդով ծրագրակազմ է, որը թողարկվել է Apache 2.0 թույլտվության ներքո, որը թույլ է տալիս առևտրային օգտագործում, փոփոխություն և կրկնահատուցում։ TextToSpeechAI-ի վրա Tortoise-ը Ultra մակարդակ է՝ 1000 այբուբենի համար 50 դրամ, քանի որ այն մեծ հաշվարկային պահանջներ ունի և արտահայտիչ արտադրանքի որակ է տալիս։

Tortoise- ն դանդաղ է իր նախագծով. այն ստեղծում է մի քանի թեկնածու կտորներ ինքնակենսագրական կերպով և ապա բարելավում լավագույնը մոդելի և CLVP- ի վեր- դասակարգման քայլով։ Այս որակ- առաջին ջրատարը նշանակում է, որ մեկ կտորը կարող է տևել 30 վայրկյանից մինչև մի քանի րոպե՝ կախված տեքստի երկարությունից և նախատեսված որակից։ Բայց Tortoise- ն ապահովում է ամենաբարձր բնական ձայնը ցանկացած TTS սարքի համար։

Tortoise- ը առաջարկում է չորս նախնական ընտրություն, որոնք փոխանակում են արագությունը որակի հետ՝ ultra_fast (~10x արագ, լավ է փորձարկման համար), fast (~4x արագ, արտադրության լռելյայն), standard (համաձայնեցված) և high_ quality (մեծագույն որակը, դանդաղագույնը)։ Ավելի բարձր նախնական ընտրությունները ավելի շատ թեկնածուներ են վերցնում և ավելի շատ քայլներ են կատարում լավագույն արդյունքը ընտրելուց առաջ։ TextToSpeechAI- ում դուք կարող եք ընտրել նախնական ընտրությունը սերվերի ստեղծմանը նախորդող ժամանակահատվածում։

Այո, Tortoise TTS- ը աջակցում է ձայնի կլոնավորմանը բացառիկ հավատարմությամբ։ Տեղադրեք նպատակային ձայնի մի քանի կարճ հղումային կտորներ (հատկապես 3-10 օրինակ յուրաքանչյուրը 5-10 վայրկյան տևողությամբ), և Tortoise- ն կգրավի խոսողի ձայնի տեմպը, ակորդը, արագությունը և մանրամասն միկրո- արտահայտությունները։ Սա ամենադյուրին 0-shot կլոնավորման մեխանիզմներից է, չնայած կլոնավորումը ավելացնում է արդեն իսկ երկար սերվերի ստեղծման ժամանակը։

Tortoise- ը հիմնականում սովորեցվել է անգլերեն խոսակցության տվյալների բազայի վրա, այնպես որ անգլերենն է, որտեղ այն ունի ամենաբարձր որակը։ Բազմալեզու ծրագրերի համար, որոնք նման իրականության կարիք ունեն, կարող եք օգտագործել F5- TTS կամ CosyVoice2 TextToSpeechAI- ում, որոնք աջակցում են ավելի շատ լեզուների, սակայն ձայնի կլոնինգի հնարավորություն են տալիս։

Tortoise-ը արտադրում է բացառիկ, հաճախ մարդուց անբաժանելի ձայն. Այն գրանցում է շնչառությունը, դժվարությունը, ինտոնացիան և իրական զգացմունքային ռեզոնանսը, որը բացակայում է ավելի թեթև մոդելներից։ Ահա թե ինչու այն շարունակում է մնալ սիրված ձայնագրության համար, ֆիլմերի պատմման համար և բարձրորակ ձայնագրության համար, որտեղ իրականությունը գերակա է։

Tortoise-ը սովորաբար պահանջում է 12-24 ԳԲ VRAM, կախված որակի նախահաշվից և խմբի չափից, այնպես որ տեղական օգտագործման համար խորհուրդ է տրվում օգտագործել RTX 3090, 4090 կամ A100-ի նման բարձրորակ GPU-ներ։ CPU-ի ինֆորմացիան տեխնիկապես հնարավոր է, բայց շատ դանդաղ։ TextToSpeechAI-ի դեպքում մոդելը աշխատում է մեր GPU-ի ինֆրակառուցվածքի վրա, այնպես որ դուք չունեք սեփական սարքավորման կարիք։

Tortoise-ը բնական կերպով ցուցադրում է բարձրորակ 24kHz WAV ձայնագրություն։ TextToSpeechAI-ի միջոցով դուք կարող եք խնդրել MP3, WAV կամ OGG, և մենք փոխկոդավորում ենք որակ պահպանող կոդավորումներով, որպեսզի դուք պահպանեք մոդելի մանրամասնությունները ցանկացած ձևաչափում, որը ձեր նախագծին անհրաժեշտ է։

Tortoise-ը Ultra գնահատման մակարդակում է՝ 50 դրամ յուրաքանչյուր 1000 կերպար համար, որը արտացոլում է GPU-ի ժամանակը, որը օգտագործում է իր որակյալ ջրատարը։ Նոր հաշիվները ստանում են անվճար սկզբնական վարկ, այնպես որ դուք կարող եք փորձարկել Tortoise-ը մինչև գրանցումը։ Ultra մակարդակը նաև ներառում է StyleTTS2, OpenVoice, Dia և Zonos։

Երկուսն էլ Ultra- դասակարգման մոդելներ են, բայց տարբեր գործողություններ են կատարում։ Tortoise TTS- ն հասնում է բնականության և զգացմունքային խորության ամենաբարձր մակարդակին, սակայն այն ամենաշատ դանդաղ գործող մոդելներից է։ StyleTTS2- ն առաջարկում է Tortoise- ի մոտ որակ՝ շատ ավելի արագ սերվերով, որն ավելի լավ ընտրություն է, երբ դուք շատ կտորներ կամ ավելի արագ սերվերներ եք ցանկանում։ Ընտրեք Tortoise- ն, երբ որակը չի կարող փոխզիջման ենթարկվել և ժամանակը չի սահմանափակում։

Այո։ Գրանցվեք TextToSpeechAI համարով՝ անվճար սկզբնական վարկային քարտեր ստանալու համար, կամ օգտագործեք ցուցադրությունը էջում և ընտրեք Tortoise ձայնը՝ առանց որևէ բան տեղադրելու ձայնագրություն ստեղծելու համար։ Որովհետև Tortoise-ը դանդաղ է, սկսեք կարճ նախադասությամբ և «արագ» նախահաշվով՝ տեսնելու համար որակը երկար աշխատանքներ սկսելուց առաջ։

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try Tortoise TTS Now

Generate your first audio free. No credit card required.

Start Free