Tortoise TTS

Ultra

Юқори сифатли сўзлашув ва тенгсиз табиийлик

Very Slow Тезлик
Exceptional Сифати
Ҳа Клонлаш
1 Тиллар

Маълумот Tortoise TTS

s available. Tortoise TTS is a

Ключа хусусиятлар

Жуда юқори сифат

Қолган энг табиий овозли TTS чиқиндиси.

Товушни клонлаш

Овозларни ажойиб ишонч ва ранглар билан клонлаш.

Табиий Прозоди

Суҳбатнинг майда-чуйда намуналарини ва микро-ифодаларни ёзиб олади.

Сифат олдинги мосламалари

Ultra_fast ёки high_quality ишлашдан бирини танланг.

Эмоция чуқурлиги

Ҳақиқий ҳиссий резонанс билан сўзлашувни яратиш.

Очиқ манба

Apache 2.0 лицензияси билан савдо мақсадларида фойдаланиш ҳуқуқи билан.

Ишлатиш ҳолатлари

Premium аудиокитоблар Фильм ишлаб чиқариш Ҳужжатли ҳикоя Профессионал овозли ёзувлар Архив лойиҳалари High-End мазмуни

Tortoise TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

Қўллаш усули Tortoise TTS

  1. 1

    Ройхатдан ўтиш ёки бепул демони синаш

    Тадбиркорлик кредитларини олиш учун бепул TextToSpeechAI ҳисобни яратинг ёки Tortoise'ни киришсиз синаш учун уй саҳифаси демосини фойдаланинг. Tortoise Ultra-tier мотори (1000 ҳарф учун 50 кредит), шунинг учун бепул кредитлар биринчи қисқа синов учун жуда яхши.

  2. 2

    Tortoise'ни танланг ва клонлаш учун овозни қўшинг

    Товуш браузеридан Tortoise овозини танланг. Айрим шахсни клонлаш учун, манбаий клипни юклаб олинг (идеал ҳолда 5-10 сониялик бир неча тоза намуналар) ва Tortoise бу овозни юқори ишонч билан қайта ишлайди. Агар йўқ бўлса, Tortoise овозларидан бирини танланг.

  3. 3

    Матнингизни киритинг

    Ёзиб ёки жойлаб, айтиб бермоқчи бўлган матнингизни киритинг. Tortoise секинлиги учун, тўлиқ аудиокитоб бобини ёки узун скриптни юборишдан олдин овоз ва товушни тасдиқлаш учун қисқа парча билан бошланг.

  4. 4

    Сифатини танлаб олиш ва яратиш

    Tortoise сифатини танланг: тезкор синовлар учун ultra_fast, тезкор тезлик/хусусийлик баланси учун fast (мақбул стандарт), стандарт ёки максимал реаллик учун high_quality. Сўнгра яратиш тугмасини босинг ва сабр қилинг - Tortoise ҳар бир клип учун 30 сониядан бир неча дақиқагача вақтни олади, айниқса юқори сифатли олдиндан белгиланганда.

  5. 5

    API юклаб олиш ёки фойдаланиш

    Юклаш тугаганида, аудиони MP3, WAV ёки OGG шаклида юклаб олинг ёки тарихингиздан олиб олинг. Tortoise ишини автоматлаштириш учун TextToSpeechAI API ни чақиринг ва танланган сифатни олдиндан белгилаб беринг - Tortoise тезроқ ишлайди, шунинг учун вақтни узайтиришни унутманг.

Tortoise TTS API

TextToSpeechAI REST API ёрдамида дастурий сўзлашув яратиш.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Tortoise вақтини олади, аммо натижа кутишга арзийди.",
    "voice": "tortoise-angie"
  }'

Доимий сўраладиган саволлар

Tortoise TTS - бу James Betker томонидан яратилган аудио сифатини бошқалардан устун қўядиган авторегрессив матн-нутқ моделидир. У трансформаторга асосланган тил моделлаштиришни диффузия декодлаш билан бирлаштиради, бу эса сўзлашувни тенгсиз табиийлик, ҳиссий чуқурлик ва инсонга ўхшаш прозодия билан яратишга имкон беради. У кенг тарқалган энг реалистик очиқ манбали TTS моторларидан бири сифатида тан олинган.

Ҳа. Tortoise TTS Apache 2.0 лицензияси остида очиқ манбали бўлиб, у савдо мақсадларида фойдаланиш, ўзгартириш ва қайта тарқатишга рухсат беради. TextToSpeechAI'да Tortoise Ultra даражасида 1000 ҳарф учун 50 кредитга эга бўлиб, бу унинг юқори ҳисоблаш талаблари ва ажойиб чиқим сифати туфайли.

Tortoise дизайни жуда секин: у бир неча номзод клипларни авторегрессив равишда яратиб, кейин энг яхшисини диффузия модели ва CLVP қайта-ранглаш қадами билан яхшилайди. Бу сифат-бошқарув қувури биргина клип матн узунлиги ва сифат-бошқарув қувури билан боғлиқ ҳолда 30 сониядан бир неча дақиқагача вақтни олиши мумкин. Бунинг эвазига Tortoise ҳар қандай TTS моторидан энг табиий сўзлашувни ишлаб чиқаради.

Tortoise сифат учун тезликни алмаштирувчи тўртта олдинги мосламани таклиф қилади: ultra_fast (~10x тезроқ, синов учун яхши), fast (~4x тезроқ, ишлаб чиқаришнинг олдинги ҳолати), стандарт (мувозанатли) ва high_quality (максимум сифат, энг секин). Юқори олдинги мослама кўпроқ номзодларни намуна олади ва энг яхши натижани танлашдан олдин кўпроқ диффузия омилларини бажаради. TextToSpeechAI'да сиз яратишдан олдин олдинги мосламани танлай оласиз.

Ҳа, Tortoise TTS овозни ажойиб ишонч билан клонлашни қўллаб-қувватлайди. Мақсад овознинг бир неча қисқа мисол клипларини (мақсадли 3-10 та 5-10 сониялик намуналар) тақдим қилинг, Tortoise сўзловчининг оҳанги, акценти, тезлиги ва майда микро-ифодаларини қўлга олади. Бу энг аниқ нуқсонсиз клонлаш моторларидан бири, гарчи клонлаш ҳозирги вақтда жуда узоқ ишлаб чиқариш вақтини оширса ҳам.

Tortoise асосан инглиз тилида сўзлашиш маълумотлари тўпламлари асосида тайёрланган, шунинг учун инглиз тилида унинг сифати энг кучли. Бир хил реаллик талаб қиладиган кўп тилли лойиҳалар учун, F5-TTS ёки TextToSpeechAI'даги CosyVoice2'ни кўриб чиқинг, улар овозни клонлашни таклиф қилган ҳолда кўпроқ тилларни қўллаб-қувватлайди.

Tortoise ажойиб, инсон овозидан фарқланмайдиган овозни ҳосил қилади. У нафас олиш, қийналишни, интонацияни ва енгилроқ моделларда йўқотиладиган ҳақиқий ҳиссий резонансни қўлга олади. Шунинг учун у реалистиклик энг муҳим бўлган аудиокитоблар, фильмлар ҳикояси ва юқори даражадаги овозли сўзлашув ишларида севимли бўлиб қолмоқда.

Tortoise сифати ва партия ҳажмига қараб 12-24GB VRAM талаб қилади, шунинг учун маҳаллий фойдаланиш учун RTX 3090, 4090 ёки A100 каби юқори даражадаги GPU тавсия этилади. CPU индукцияси техник жиҳатдан мумкин, аммо жуда секин. TextToSpeechAI моделда GPU инфратузилмасида ишлайди, шунинг учун сизга ўзингизнинг жиҳозингизга эҳтиёж йўқ.

Tortoise юқори сифатли 24kHz WAV аудиони ўз-ўзидан кўрсатади. TextToSpeechAI орқали сиз MP3, WAV ёки OGG форматларини сўрашингиз мумкин, ва биз сифатни сақлаб қолувчи кодлаш билан транскод қиламиз, шунинг учун сиз лойиҳангизга керак бўлган ҳар қандай форматда моделнинг майда деталларини сақлайсиз.

Tortoise Ultra нархлаш даражасида 1000 ҳарф учун 50 кредитга эга бўлиб, GPU вақтини унинг сифат-бошқарув қувурининг сарфланишини акс эттиради. Янги ҳисоблар бепул бошланғич кредитларни олади, шунинг учун Tortoise'ни топширишдан олдин синашингиз мумкин. Ultra даражаси StyleTTS2, OpenVoice, Dia ва Zonos'ни ҳам қамраб олади.

Иккаласи ҳам Ultra-tier моторлар, лекин улар турлича ишлайди. Tortoise TTS табиийлик ва ҳиссий чуқурликнинг энг юқори нуқтасига етади, аммо энг секин мотордир. StyleTTS2 жуда тезроқ генерация билан Tortoise'га яқин сифатни тақдим этади, бу сиз кўпроқ клипларга ёки тезроқ айланишга эҳтиёж сезганингизда яхшироқ танловга айланиши мумкин. Агар сифат келишувга асосланмаган ва вақт чеклови бўлмаса, Tortoise'ни танланг.

Ҳа. Бепул бошланғич кредитларни олиш учун TextToSpeechAI рақамига қўнғироқ қилинг ёки уй саҳифасидаги демодан фойдаланинг ва ҳеч нарса ўрнатмасдан клип яратиш учун Tortoise овозини танланг. Tortoise секинлиги сабабли, қисқа жумла билан ва "тез" олдинги мослама билан бошланг, бу билан узоқ ишларни бажаришдан олдин сифатни кўришингиз мумкин.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try Tortoise TTS Now

Generate your first audio free. No credit card required.

Start Free