StilTTS 2
UltraTekst til tale fra mennesker med stiloverføring
Om StilTTS 2
StilTTS 2 gir tekst- til- tale- syntese på menneskenivå gjennom stilspredning og antagonistisk trening. Den kan overføre talestiler fra referanse- lyd samtidig som den lager svært naturlig tale som rivalerer virkelige opptak. StyleTTS 2 representerer det nyeste i TTS- kvalitet og naturalitet.
Nøkkelfunksjoner
Menneskelig kvalitet
Produserer tale som ikke kan skilles fra opptak fra mennesker i blindprøver.
Stiloverføring
Overfør talestil fra alle referanselydprøver.
Naturlig prosody
Perfekt rytme, stress og intonasjon med diffusjonsbasert modellering.
Stemmekloning
Klone stemmer med ekstraordinær nøyaktighet og naturlighet.
Rask avslutning
Hurtigere enn autoregressive modeller samtidig som kvaliteten opprettholdes.
Åpne kildekode
MIT med fulle rettigheter til kommersiell bruk.
Brukstilfeller
StilTTS 2 Voices
View All 6StyleTTS2 Default
ENStyleTTS2 Expressive
ENStyleTTS2 Fast
ENStyleTTS2 Natural
ENStyleTTS2 Neutral
ENStyleTTS2 Quality
ENBruksmåte StilTTS 2
-
1
Registrer deg ledig eller kjør demoen
Lag en gratis TextToSpeechAI konto for å få startpoeng, eller bruk en demo på nettsiden for å høre StyleTTS2 uten å logge på.
-
2
Velg stilTTS2- motor
Velg en stilTTS2- stemme fra stemmebiblioteket. For å klone en stemme, laster du opp et 10-30 sekunds referanseklipp, og stilsett 2 overfører stilen sin.
-
3
Skriv inn teksten
Lim inn eller skriv inn skriptet du vil ha fortalt. StilTTS2 excelerer på engelsk og leverer naturlig prosodi, stress og intonasjon over lange avsnitt.
-
4
Lag lyd
Trykk generer og TextToSpeechAI tegner stilTTS2- lyden din på GPU. Ultranivå stilTTS2 koster 50 poeng per 1000 tegn.
-
5
Last ned eller bruk API
Last ned ferdig StyleTTS2- lyd som MP3, WAV eller OGG, eller ring TextToSpeechAI API med din StyleTTS2- stemme for å automatisere genereringen.
StilTTS 2 API
Generer taleprogrammatisk ved å bruke TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "StilTTS 2 produserer tale så naturlig at den konkurrerer med profesjonelle menneskelige opptak.",
"voice": "styletts2-default"
}'
Ofte stilte spørsmål
Technical Specs
- Generation Speed Moderate
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 4-6GB
- Credits/1000 chars 50