GPT-SoVITS
PremiumMazshot balss klonēšana ar visaugstāko kvalitāti
Par GPT-SoVITS
GPT-SoVITS apvieno GPT stila valodas modelēšanu ar SoVITS balss konversiju, lai sasniegtu modernāko, nedaudz smailo balss klonēšanu. Ar tikai 3-10 sekundēm atsauces audio un transkriptu tas rada ārkārtīgi dabas runu, kas cieši atbilst mērķa balss. Tas ir izcili starpvalodu sintēzē - apmācās vienu valodu un rada citā.
Galvenās iezīmes
Mazshot balss klonēšana
Apklājiet jebkuru balsi no 3-10 sekundēm uzziņas audio ar transkriptu, lai nodrošinātu labāko kvalitāti.
Kryžmiskās sintēzes
Train par vienu valodu un radīt runu ķīniešu, angļu, japāņu, korejiešu, vai Kantoniešu.
Augstākā kvalitāte
GPT-SoVITS ir viens no augstākās kvalitātes balss klonēšanas modeļiem.
Atvērt avotu
Pilni MIT licencēta ar aktīvu kopienas attīstību un plašu dokumentāciju.
Lietot gadījumus
Kā lietot GPT-SoVITS
-
1
Izveidot bezmaksas kontu vai atvērt demo
Pierakstīties TextToSpeechAI saņemt bezmaksas startera kredītus, vai lēkt taisni uz demo izmēģināt GPT-SoVITS bez pierakstīšanās nepieciešams.
-
2
Izvēlieties GPT- SoVITS un augšupielādējiet atsauces klipu
Izvēlieties GPT-SoVITS kā savu dzinēju, tad augšupielādējiet 3-10 otro atsauces klipu balsi, kuru vēlaties klonēt. Pievienojot tranrakstu no šī klipa sniedz tīrāko, precīzāko klonu.
-
3
Ievadiet tekstu
Veido vai ielīmēt tekstu, kuru vēlaties runāt klonētā balsī. GPT-SoVITS atbalsta ķīniešu, angļu, japāņu, korejiešu, un kantoniešu, tostarp krusteniskās valodas klonēšanu no atsauces citā valodā.
-
4
Ģenerēt audio
Noklikšķiniet, lai nosūtītu darbu uz mūsu GPU serveriem. GPT-SoVITS padara teicamu un kvalitatīvu klonētu runu ar vidēju ātrumu, ar 25 kredītrēķini par 1000 rakstzīmēm.
-
5
Lejupielādēt vai izmantot API
Lejupielādēt savu pabeigto GPT-SoVITS audio kā failu, vai automate paaudzes caur TextToSpeechAI REST API pie api.texttospeechai.com ražošanas darbplūsmas.
GPT-SoVITS API
Ģenerēt runas programmēti, izmantojot TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "GPT\u002DSoVITS rada augstākās kvalitātes balss klonēšanu tikai no dažām audio sekundēm.",
"voice": "en_US-lessac-medium"
}'
Bieži uzdoti jautājumi
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-8GB
- Credits/1000 chars 25