TTS torotizācija

Ultra

Ultra-augstas kvalitātes runa ar nesaskaņotu dabas

Very Slow Ātrums
Exceptional Kvalitāte
Klonēšana
1 Valodas

Par TTS torotizācija

Tortoise TTS ir autoregresīvs teksta-to-speech modelis, kas nosaka skaņas kvalitāti par prioritāti. Izmantojot autoregresīvo transformatoru un difūzijas modeļu kombināciju, Tortoise rada ārkārtīgi dabīgu runu, kas uztver smalkas cilvēka balss nianses. Lēnāk nekā citi modeļi Tortoise rada visdabiskāko pieejamo TTS izvadi.

Galvenās iezīmes

Ultra-augsta kvalitāte

Dabiskākā TTS izlaide pieejama.

Balss klonēšana

Klonēt balsis ar īpašu uzticību un niansi.

Dabiskā prozodija

Notver smalkas runas un mikroekspresijas.

Kvalitātes priekšsesti

Izvēlieties no ultra_fast līdz augstas kvalitātes apstrādei.

Emocionālais dziļums

Runāšana ir saistīta ar patiesu emocionālu rezonansi.

Atvērt avotu

Apache 2.0 licencētas ar komerciālās lietošanas tiesībām.

Lietot gadījumus

Premium audiogrāmatas Filmu ražošana Dokumentu narācija Profesionāli balss pārsniegumi Arhivālie projekti Augstas stiprības saturs

TTS torotizācija Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

Kā lietot TTS torotizācija

  1. 1

    Pierakstīties vai mēģināt bezmaksas demo

    Izveidot bezmaksas TextToSpeechAI kontu, lai saņemtu startera kredītus, vai izmantot mājas lapas demo izmēģināt Tortoise bez pierakstīšanās. Tortoise ir Ultra līmeņa motors (50 kredīti uz 1000 rakstzīmēm), tāpēc bezmaksas kredīti ir ideāli par pirmo īsu testu.

  2. 2

    Izvēlieties klonu un pēc izvēles pievienot klonam balsi

    Izvēlieties skaļruni no balss pārlūka. Lai klonētu konkrētu personu, augšupielādējiet uzziņu (vislabāk dažus tīrus 5-10 sekunžu paraugus) un Tortoise reproducēs šo balsi ar augstu uzticamību. Pretējā gadījumā izvēlieties vienu no iebūvētajām, stiprajām un stiprajām balsīm.

  3. 3

    Ievadiet tekstu

    Ierakstiet vai ielīmējiet tekstu, kuru vēlaties stāstīt. Jo Tortoise ir lēns, sāciet ar īsu izeju, lai apstiprinātu balsi un toni, pirms sūtāt pilnu audiogrāmatas nodaļu vai garu skriptu.

  4. 4

    Izvēlieties kvalitātes priekšstādītu un ģenerējiet

    Izvēlieties stipro kvalitātes priekšstādītu: īpaši_ātri ātriem testiem, ātri laba ātruma/kvalitātes līdzsvaram (ieteicams noklusējums), standarta vai augstas_kvalitātes maksimālam reālismam. Tad noklikšķiniet uz ģenerēt un būt pacietīgam - grieziens var ilgt no 30 sekundēm līdz vairākām minūtēm uz vienu klipu, īpaši pie augstākiem priekšstādījumiem.

  5. 5

    Lejupielādēt vai izmantot API

    Kad paaudze pabeidz darbu, lejupielādējiet audio kā MP3, WAV vai OGG, vai ielādējiet to no jūsu vēstures. Lai automātiski varētu veikt Tortoise darbus, zvaniet TextToSpeechAI API un iziet savu izvēlēto kvalitātes priekšstādīt - atcerieties, lai atļautu ilgāku laiku, jo Tortoise parādās lēni.

TTS torotizācija API

Ģenerēt runas programmēti, izmantojot TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Tortoise aizņem savu laiku, bet rezultāti ir vērts gaidīt.",
    "voice": "tortoise-angie"
  }'

Bieži uzdoti jautājumi

Tortoise TTS ir autoregresīvs teksta-to-speech modelis, ko veidojis James Betker, kas nosaka audio kvalitāti par prioritāti. Tas apvieno transformatoru valodas modelēšanu ar difūzijas dekodēšanu, lai radītu runu ar nepieskaņotu dabas, emocionālo dziļumu un cilvēka veida prozodi. To plaši uzskata par vienu no reālistiskākajiem atvērtā avota TTS dzinējiem.

Jā. Tortoise TTS ir atvērts avots saskaņā ar atļauto Apache 2.0 licence, kas ļauj komerciālo izmantošanu, modifikācijas, un pārdali. Uz TextToSpeechAI, Tortoise sēž Ultra pakā pie 50 kredītiem uz 1000 rakstzīmēm, jo tās smagos comute prasībām un ārkārtas izejas kvalitāti.

Tortoise ir lēns pēc dizaina: tas rada vairākas kandidāta klipus automātiski un pēc tam pilnveido labāko ar difuzijos modeli un CLVP pārkārtošanas pakāpi soli. Šis kvalitātes pirmais cauruļvads nozīmē, ka viens klips var ilgt no 30 sekundēm līdz vairākām minūtēm atkarībā no teksta garuma un kvalitātes priekšiestatījuma. Komplekts ir tāds, ka Tortoise rada dažas no visdabiskākajām runas jebkura TTS dzinēja.

Tortoise piedāvā četrus tirdzniecības ātrumus: ultra_fast (~10x ātrāk, labs testēšanai), ātri (~4x ātrāk, ražošanas noklusējuma), standarta (līdzsvarots) un augstas_kvalitātes (maksimālā kvalitāte, lēnāk). Augstāks priekšsastats ņem vairāk kandidātu un veic vairāk difuzijos soļus, pirms izvēloties labāko rezultātu. TextToSpeechAI.

Jā, Tortoise TTS atbalsta balss klonēšanu ar ārkārtēju ticamību. Nodrošiniet dažus īsus mērķa balss klipus (ideāli 3-10 paraugus 5-10 sekundes katrā), un Tortoise iemūžina runātāja timbre, akcentu, pacing un smalkas mikroekspresijas. Tas ir viens no precīzākajiem nulles spīduma klonēšanas dzinējiem, lai gan klonēšana palielina jau ilgu paaudzes laiku.

Tortoise tika apmācīts galvenokārt angļu valodas valodas datu kopas, tāpēc angļu valoda ir vieta, kur tās kvalitāte ir spēcīgāka. Daudzvalodu projektiem, kuriem ir nepieciešams līdzīgs reālisms, apsvērt F5-TTS vai CosyVoice2 par TextToSpeechAI, kas atbalsta vairāk valodu, vienlaikus piedāvājot balss klonēšanu.

Tortoise rada ārkārtēju, bieži vien neatšķiramu, no cilvēka audio. Tas uztver elpošanas, dusmas, intonācijas un patiesu emocionālu rezonansi, kas izlaiž garām modeļiem. Tāpēc tas joprojām ir mīļākais premium audiogrāmatām, filmu naratizācijai un augstas klases balss pārsvaram, kur reālisms ir ļoti svarīgs.

Tortoise parasti prasa 12-24GB VRAM atkarībā no kvalitātes priekšstādē un partijas izmēra, tāpēc augstas klases GPU, piemēram, RTX 3090, 4090, vai A100 ir ieteicams vietējai lietošanai. Procesora iejaukšanās ir tehniski iespējama, bet ļoti lēna. Uz TextToSpeechAI modelis darbojas uz mūsu GPU infrastruktūru, tāpēc jums nav nepieciešama nekāda aparatūra no jūsu pašu.

Tortoise natively renders high-quality 24kHz WAV audio. Through TextToSpeechAI you can request MP3, WAV, or OGG, and we transcode with quality-preserving encoding so you keep the model's fine detail in whatever format your project needs.

Tortoise ir Ultra cenu līmenī 50 kredītpunktiem uz 1000 rakstu zīmēm, atspoguļojot GPU laiku, kad tā kvalitātes pirmais cauruļvads patērē. Jaunie konti saņem bezmaksas startera kredītus, lai jūs varētu pārbaudīt Tortoise pirms saistību uzņemšanās. Ultra līmenis aptver arī StyleTTS2, OpenVoice, Dia, un Zonos.

Abi ir Ultra līmeņa dzinēji, bet tie tirgojas savādāk. Tortoise TTS sasniedz absolūto dabas un emocionālā dziļuma maksimumu, bet ir līdz šim lēnākais motors. StyleTTS2 nodrošina gandrīz Trotoise kvalitāti ar daudz ātrāku paaudzi, padarot to par labāku izvēli, kad jums ir nepieciešams daudz klipu vai ātrāka apgriezieni. Izvēlieties Tortoise, ja kvalitāte nav apspriežama un laiks nav ierobežojums.

Jā. Pierakstīties uz TextToSpeechAI, lai saņemtu bezmaksas startera kredītus, vai izmantot demo mājas lapā, un izvēlēties Tortoise balss, lai radītu klipu bez instalēšanas neko. Jo Tortoise ir lēns, sākt ar īsu teikumu un "ātrs" preset redzēt kvalitāti, pirms darbojas ilgākas darbavietas.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try TTS torotizācija Now

Generate your first audio free. No credit card required.

Start Free