VITS

Standard

Brzo kraj do krajnji TTS s prirodnim govorom

Very Fast Brzina
Good Kvaliteta
Ne. Kloniranje
10 Jezici

O VITS

VITS (Varicionalni zaključak s adversarial učenje za krajnje-na-krajnje Tekst-na-speak) je brz, kraj-na-konc neurolni TTS model koji proizvodi prirodno-zvučni govor. Kombinira varijacionalni autokodere s adversarialni trening za efikasnu sintezu. VITS je odličan za obradu serije i aplikacije zahtijevaju i kvalitetu i brzinu.

Ključne osobine

Brzo sintetiziranje

Kraj-to-kraj arhitektura za brzo nastajanje govora.

Obrada paketa

Učinkovito obraditi više tekstova istovremeno.

Prirodni govor

VAE+GAN trening proizvodi prirodnu prozodiju i ritam.

Višezvučni

Jedan model podržava više zvučnika.

Učinkovito

Niski otisak memorije s dobrom performansom.

Otvori izvor

MIT licenciran za bilo koji slučaj korištenja.

Slučaji korištenja

Paketska stvaranje zvuka E-učenje platforma Čitatelji novosti Automatski najave IVR sustavi Sadržaj visoke volume

VITS Voices

View All 109
LJSpeech (English Female)
EN
VCTK Speaker 225 (English Female)
EN
VCTK Speaker 226 (English Male)
EN
VCTK Speaker 227 (English Male)
EN
VCTK Speaker 228 (English Female)
EN
VCTK Speaker 229
EN
VCTK Speaker 230
EN
VCTK Speaker 231
EN
VCTK Speaker 232
EN
VCTK Speaker 233
EN
VCTK Speaker 234
EN
VCTK Speaker 236
EN

Kako koristiti VITS

  1. 1

    Prijavite se besplatno ili pokušajte demo

    Stvorite besplatni TextToSpeechAI račun za dobivanje početnih kredita, ili koristite on-stranica demo za čuti VITS prije prijave.

  2. 2

    Odaberite VITS glas ili zvučnik

    Pregledajte glasovnu knjižnicu i odaberite glas označen VITS značkom. Višezvočnica VITS biblioteka, uključujući VCTK zvučnik, omogućuje vam odabir iz mnogih različitih glasova.

  3. 3

    Unesite vaš tekst

    Upišite ili umetnite tekst koji želite govoriti u urednik. VITS upravlja dugim prolazanjem dobro i idealan je za serijski i visoke volume sadržaj.

  4. 4

    Generiraj zvuk

    Kliknite generirati za sintetiziranje govora s VITS. Budući da je VITS je vrlo brz i Standard-tier (10 kredita po 1000 znakova), rezultati brzo vratiti po niskoj cijeni.

  5. 5

    Preuzmi ili koristi API

    Preuzmite završetak zvuka kao MP3, WAV, ili OGG, ili pozovite isti VITS glas kroz TextToSpeechAI REST API za automatizaciju generacije u vlastitoj aplikaciji.

VITS API

Generiraj govor programski koristeći TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "VITS pruža brz, prirodni govor za velike objekate aplikacije.",
    "voice": "vits-ljspeech"
  }'

Česta pitanja

VITS (Varicionalni inferencija s adversarial učenje za krajnje-na-konac Tekst-na-speak) je kraj-konac neurolni TTS model koji kombinira varijacionalni autokoder s adversarial GAN trening. To stvara prirodno-zvučni govor u jednom prolazu, što ga čini brzim i učinkovitim. Možete probati VITS besplatno na TextToSpeechAI.

Da, VITS je otvoreni izvor u okviru licence MIT, tako da podržava punu komercijalnu upotrebu bez ograničenja. Širom se koristi u komercijalne proizvode i usluge. Na TextToSpeechAI, VITS košta 10 kredita na 1000 znakova na standardnom nivou.

TextToSpeechAI nudi veliku višezvučnu VITS biblioteku, uključujući VCTK glasni skup s desetinama različitih engleskih zvučnika. Jedan model VITS može biti domaćin mnogih zvučnika, tako da možete izabrati iz mnogih različitih glasova bez prekidača motora.

VITS podrška ovisi o obučenom modelu. Zajednički modeli VITS pokrivaju engleski, kineski, japanski, korejski, njemački, francuski i drugi glavni jeziki, s višezvučničkim engleskim pokrićem iz VCTK dataseta.

VITS je vrlo brz, stvarajući govor u stvarnom vremenu ili brže na GPU. Njegova krajnja arhitektura izbjegava višestruke faze obrade drugih modela, što je razlog zašto VITS je dobro prikladan za serijski i visoke volumen sinteze.

Ne, VITS ne podržava kloniranje glasa. Koristi prije obučene višezvučnike umjesto kopiranja ciljnog glasa iz uzorka. Za kloniranje glasa na TextToSpeechAI, koristite F5-TTS ili GPT-SoviTS umjesto toga.

VITS proizvodi kvalitetan zvuk s prirodnom prozodijom i ritmom. Iako nije na razini StyleTTS 2 ili Tortoise, nudi odličnu kvalitetu za svoju brzinu, posebno za obradu serije.

VITS je memorijski efikasan, obično treba samo nekoliko GB VRAM-a (oko 4GB). Ona radi udobno na potrošački GPU-a, a na TextToSpeechAI sve iscrtavanje događa na našim poslužiteljima tako da ne trebate bilo koji hardver vlastiti.

VITS i Piper su brzi, standardno-licensirani MIT motori na TextToSpeechAI. Piper je najlaganija i najbrža opcija, dok VITS nudi veliku multi-zvučničku biblioteku (uključujući VCTK) s malo više prirodne prozodije. Niti podržava kloniranje glasa.

VITS je standard-tier motor, koji košta 10 kredita na 1000 znakova. Ovo je naš najniži nivo cijena zahvaljujući učinkovitoj, brzoj prirodi modela VITS.

VITS proizvodi zvuk na 22050Hz na materini. Kroz TextToSpeechAI možete tražiti MP3, WAV ili OGGG formate, s automatskim pretvorbom koji se obrađuje za vas.

Prijavite se na TextToSpeechAI za primanje besplatnih starter kredita, zatim pokupite VITS glas, unesite tekst i generirajte audio. Također možete koristiti demo za čuti VITS prije stvaranja računa, i pristup VITS kroz naš REST API nakon što se prijavite.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 10
  • GPU VRAM 1-2GB
  • Credits/1000 chars 10

Try VITS Now

Generate your first audio free. No credit card required.

Start Free