StyleTTS 2
UltraTexti-í-tal á mannlegum stigum með stílflutningi
Um StyleTTS 2
s. StyleTTS 2 is a
Lykilatriði
Gæði á mannlegum stigum
Framleiðir tal ógreinanlegt frá mannlegum upptökum í blindum prófum.
Flytja stíl
Flytja tala stíl frá hvaða tilvísun hljóð sýnishorn.
Náttúruleg orðræða
Perfect taktur, streitu og intonation með dreifingu-undirstaða líkan.
Raddklóðun
Clone raddir með óvenjulegri nákvæmni og náttúruleika.
Fljótur niðurstaða
Hraðar en autoregressive módel en viðhalda gæðum.
Opinn kóði
MIT leyfi með fullum viðskiptalegum notkunarréttindum.
Nota tilfelli
StyleTTS 2 Voices
View All 6StyleTTS2 Default
ENStyleTTS2 Expressive
ENStyleTTS2 Fast
ENStyleTTS2 Natural
ENStyleTTS2 Neutral
ENStyleTTS2 Quality
ENHvernig á að nota StyleTTS 2
-
1
Skráðu þig ókeypis eða keyrðu kynninguna
Búðu til ókeypis TextToSpeechAI reikning til að fá byrjunarpunkta, eða notaðu heimasíðuna til að heyra StyleTTS2 án þess að skrá þig inn.
-
2
Veldu StyleTTS2 vél
Veldu StyleTTS2 rödd úr rödd safninu. Til að klóna rödd, hlaða 10-30 sekúndna tilvísun myndskeið og StyleTTS2 mun flytja stíl hennar.
-
3
Sláðu inn textann þinn
StyleTTS2 er frábært á ensku og skilar náttúrulegum prosody, streitu og intonation yfir langa kafla.StyleTTS2 er frábært á ensku og skilar náttúrulegum prosody, streitu og intonation yfir langa kafla.
-
4
Búa til hljóð
Smelltu á búa til og TextToSpeechAI gerir StyleTTS2 hljóð á GPU.Ultra-tier StyleTTS2 kostar 50 einingar á 1000 stafi.
-
5
Hlaða niður eða nota API
Sækja fullunna StyleTTS2 hljóð sem MP3, WAV eða OGG, eða hringja í TextToSpeechAI API með StyleTTS2 rödd til að sjálfvirka kynslóð.
StyleTTS 2 API
Búa til ræðu forritunarlega með TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "StyleTTS 2 framleiðir ræðu svo eðlilegt, það keppist við faglega mannlegar upptökur.",
"voice": "styletts2-default"
}'
Algengar spurningar
Technical Specs
- Generation Speed Moderate
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 4-6GB
- Credits/1000 chars 50