Tērzēšanas kaste

Premium

Nulles staru balss klonēšana ar izteiksmīgu runu 23 valodās

Fast Ātrums
Very Good Kvalitāte
Klonēšana
23 Valodas

Par Tērzēšanas kaste

Čatterboks ir jaudīgs balss klonēšanas TTS modelis no Atmiņas AI. Tas veic nulles kadru balss klonēšanu tikai no dažām sekundēm atsauces audio, atbalstot 23 valodas ar dabas izteiksmi. Chatterbox ietver paralingustic tags pievienot dabas skaņas, piemēram, smiekli un klepus radīt runu.

Galvenās iezīmes

Nulles starojuma balss klonēšana

Apkopot jebkuru balsi no dažām sekundēm audio - nav apmācības nepieciešams.

23 Valodas

No arābu līdz ķīniešu, aptverot lielāko daļu pasaules valodu.

Izteiksmes tagi

Pievienojiet [smejas], [smagas], [smagas], [satriecieni] dabas paralingvistiskām skaņām.

Ātra domu apmaiņa

Apakštips 200 m latentums ar Turbo variantu reālā laika lietojumiem.

Lietot gadījumus

Balss klonēšana satura radīšanai Daudzvalodu balss lietojumprogrammas Rakstzīmju balss dizains spēlēm Personalizēti balss asistenti

Kā lietot Tērzēšanas kaste

  1. 1

    Pierakstīties vai atvērt demo

    Izveidot bezmaksas TextToSpeechAI kontu pieprasīt 200 sākums kredītiem, vai izmantot on-lapas demo izmēģināt Chatterbox bez pierakstīšanās.

  2. 2

    Izvēlieties tērzēšanas kasti un pievienojiet atsauces klipu

    Izvēlieties Chatterbox dzinēju, pēc tam augšupielādējiet īsu (dažas sekundes) audio klipu no balss, kuru vēlaties klonēt. Chatterbox nulles-shot kloni tas uzreiz - nav apmācības nepieciešams.

  3. 3

    Ievadiet savu tekstu ar izvēles atzīmēm

    Ievadiet vai ielīmējiet tekstu, kas runā kādā no 23 atbalstītajām valodām, un nometiet [smejas], [smejas] vai [smadzenes] tagus, kur vien vēlaties, lai jūs vēlētos dabas paralingvistiskās skaņas.

  4. 4

    Izskaidrojiet runu

    Noklikšķiniet ģenerēt un TextToSpeechAI padara jūsu tekstu klonētā Chatterbox balss uz hosting GPU infrastruktūru, tērējot 25 kredītpunktus uz 1000 rakstzīmēm.

  5. 5

    Lejupielādēt vai izmantot API

    Lejupielādēt pabeigts audio failu, vai automate paaudzes caur TextToSpeechAI REST API atapi.texttospeechai.com, izmantojot savu kontu žetonu.

Tērzēšanas kaste API

Ģenerēt runas programmēti, izmantojot TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Čatterbox var klonēt savu balsi no tikai dažas sekundes audio un runāt 23 valodās.",
    "voice": "en_US-lessac-medium"
  }'

Bieži uzdoti jautājumi

Šašu kaste ir nulles attēla balss klonēšanas teksta-no-spīles modelis no Resemble AI. Tā var atkārtot jebkuru balsi no tikai dažām sekundēm uzziņas audio un radīt dabas, izteiksmīgu runu 23 valodās, bez jebkādām mācībām uz vienu balsi.

Jā, Chatterbox ir pilnībā licencēts MIT - gan kods, gan modeļa svars -, lai jūs varētu brīvi izmantot komerciālos produktos. Ģenerēts audio ietver izvēles nervu ūdenszīmi, kas var būt atspējota, un nav lietošanas autoratlīdzības.

Jūs varat sniegt īsu jebkuras balss atslēgvārdu (pietiek dažas sekundes) un Chatterbox ekstraktus, kas balss timbre un stilu ieliek skaļruni iegultā. Tas rada jaunu runu šajā balsī bez precizēšanas vai apmācības solis, ko nozīmē "nulles sitiens".

Šautkaste lasa īpašas inline tags tekstā, lai pievienotu dabiskas ne-verbal skaņas: [smejas] ievieto smiekli, [smejas] ievieto klepus, un [šukli] ievieto mīkstu čuklu. Vienkārši ievieto tagu, kur jūs vēlaties skaņu, piemēram, "Tas ir hileous [smejas], bet nopietni...".

Ievadiet tagu tieši ievades tekstā vietā, kur skaņai vajadzētu notikt, pārējo jūsu teikumu ieskaujot. Čatterbox klonētā balsī padara paralingustisku skaņu, to sajaucot ar apkārtējo runu, lai tā izklausītos spontāna, nevis sašķēlusi.

Šašu kaste atbalsta 23 valodas, tostarp arābu, dāņu, vācu, grieķu, angļu, spāņu, somu, franču, ebreju, hindi, itāļu, japāņu, korejiešu, Malaju, holandiešu, norvēģu, poļu, portugāļu, krievu, zviedru, suahi, turku un ķīniešu. Viens klonēts balss var runāt šajās valodās.

Čatterbox ģenerē runu ātri par GPU, un Turbo variants sasniedz sub-200m latentumu reālā laika sarunu lietošanai. Kvalitāte ir ļoti laba, ar dabas prozodija un uzticamas balss atskaņošanu no pat īsiem atsauces klipiem.

Tērzēšanas stendā nepieciešama aptuveni 4-8GB VRAM, atkarībā no varianta, turbo modelis darbojas ērti aptuveni 4GB. Uz TextToSpeechAI jums nav nepieciešama neviena vietējā GPU - paaudzes darbojas uz mūsu izvietoto infrastruktūru.

Čatterbox ir augstākās pakāpes motors, kas maksā 25 kredītus uz 1000 rakstzīmēm. Jaunie konti saņem 200 bezmaksas kredītus, lai mēģinātu balss klonēšanu, un jūs tērēt kredītus tikai uz tekstu jūs faktiski ģenerē.

Abas atbalsta nulles staru balss klonēšanu, bet Chatterbox aptver daudz vairāk valodu (23 vs 2) un pievieno izteiksmīgu paralingvistiskus tagus. F5-TTS var izkļūt no nedaudz dabiskāka angļu prozodija, tāpēc izvēlēties Chatterbox daudzvalodu klonēšanai un izteiksmīgām skaņām, un F5-TTS tikai angļu uzticamībai.

Gan piedāvā augstas kvalitātes balss klonēšanu. Čatterbox atbalsta 23 valodas un izteiksmīgus tagus, savukārt OpenVoice pievieno toņa stila kontroli (draudzīga, skumja, dusmīga un daudz ko citu), kam trūkst Chatterbox. Izvēlieties čatterbox plašai valodas aptvērumam un OpenVoice, kad jums ir nepieciešams skaidrs emocionāls toņu stils.

Jā. Pierakstīties bezmaksas TextToSpeechAI kontu, lai saņemtu 200 sākumpunkta kredītus, vai izmantot on-lapas demo dzirdēt Chatterbox bez pierakstīšanās. Uzlādējiet īsu atsauces klipu, ievadiet tekstu un ģenerējiet klonētu balsi sekundēs.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Tērzēšanas kaste Now

Generate your first audio free. No credit card required.

Start Free