F5-TTS
PremiumĀtra, fluorēta un uzticama teksta uz gleznu ar klonēšanu
Par F5-TTS
F5-TTS ir neautoregresīvs teksta-to-speech modelis, kas nodrošina ātru iedobumu, vienlaikus saglabājot augstu kvalitāti un atbalstot balss klonēšanu. Izmantojot plūsmas saskaņošanas metodes, tas rada dabīgu runu ar lielisku fleksibilitāti un uzticību references balsiem. F5-TTS piedāvā lielu līdzsvaru starp ātrumu, kvalitāti un klonēšanas spējām.
Galvenās iezīmes
Ātra paaudze
Neautoregurējošs arhitektūrā ātras runas sintēzei.
Nulles staru klonēšana
Apklājiet jebkuru balsi no īsa audio parauga bez precizēšanas.
Augsta uzticamība
Plūsmu saskaņošana rada dabisku, kvalitatīvu runas izlaidi.
Dabiskā daudzveidība
Gluds prozodija un dabiskais ritms visā.
Daudzvalodīgi
Atbalsta vairākas valodas ar dabas izruna.
Atvērt avotu
MIT licencēta pilnīgai komerciālai lietošanai.
Lietot gadījumus
Kā lietot F5-TTS
-
1
Pierakstīties bez maksas vai atvērt demo
Izveidot bezmaksas TextToSpeechAI kontu, lai saņemtu startera kredītus, vai lēkt taisni uz bezmaksas demo izmēģināt F5-TTS bez maksājuma nepieciešams.
-
2
Izvēlieties F5- TTS un (pēc izvēles) augšupielādējiet uzziņu klipu
Izvēlieties F5-TTS kā savu dzinēju. Lai klonētu balsi, augšupielādējiet īsu 10-30 otrā atbilsmes parauga mērķa skaļruni, lai F5-TTS varētu uztvert to toni un akcentēt nulles atstarojumu; izlaist šo soli, lai izmantotu iebūvēto F5-TTS balsi.
-
3
Ievadiet tekstu
Ierakstiet vai ielīmējiet tekstu, kuru vēlaties runāt. F5-TTS to lasa dabiski izvēlētajā vai klonētajā balsī, izmantojot gludu prozodi vairākās atbalstītajās valodās.
-
4
Izskaidrojiet runu
Noklikšķiniet uz ģenerēt un F5-TTS sintezē jūsu audio ātri uz mūsu GPU infrastruktūru, kas tiek apmaksāta ar Premium likmi 25 kredītpunkti uz 1000 rakstzīmēm.
-
5
Lejupielādēt vai izmantot API
Lejupielādēt pabeigto audio kā MP3, WAV vai OGG, vai piezvanīt TextToSpeechAI API ar savu F5-TTS balss ID, lai automatizētu ģenerēšanu savās lietotnēs.
F5-TTS API
Ģenerēt runas programmēti, izmantojot TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "F5\u002DTTS sniedz ātru, gludu runu ar iespaidīgām balss klonēšanas iespējām.",
"voice": "en_US-lessac-medium"
}'
Bieži uzdoti jautājumi
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 3-4GB
- Credits/1000 chars 25