OpenVoice
UltraAzonnali hang klónozás Granular Tone vezérlés
About OpenVoice
Az OpenVoice egy sokoldalú, azonnali hang klónozási modell, amely finomra vésett irányítást tesz lehetővé a beszédstílus felett. Ellentétben más klónozó modellekkel, az OpenVoice elválasztja a hangazonosságt a beszédstílustól, lehetővé teszi, hogy klónozott hangot vegyen fel és különböző hangokat alkalmazzon - vidám, szomorú, dühös, izgatott vagy suttogó - új referencia hangzás nélkül.
Kulcsfontosságú jellemzők
Azonnali klónozás
Klón bármilyen hang néhány másodpercnyi hang.
Tónusos vezérlés
Vidám, szomorú, dühös, izgatott vagy suttogó hangokat alkalmaz.
Stílusátvezetés
A hangazonosság és a beszédstílus közötti különbség a rugalmasság érdekében.
Keresztirányban
Használj klónozott hangokat különböző nyelveken.
Gyors feldolgozás
Hatékony következtetés a gyors hangnemhez.
Nyílt forrás
MIT kereskedelmi alkalmazásokra.
Esetek használata
Hogyan kell alkalmazni? OpenVoice
-
1
Regisztráljon ingyen vagy próbálja ki a demót
Hozzon létre egy ingyenes TextToSpeechAI fiókot, hogy starter krediteket kapjon, vagy használja a honlapon megjelenő demót az OpenVoice meghallgatására, mielőtt elkötelezné magát. Helyi GPU vagy telepítés nem szükséges - minden a szervereinken fut.
-
2
Válassza az OpenVoice-t és töltsön fel egy referenciaklipet
Válassza ki az OpenVoice motort, majd töltsön fel pár másodperc tiszta referencia audiót, hogy azonnal klónozza a célhangot. Az OpenVoice rögzíti a hangszóró személyazonosságát, így újra fel tudja használni bármilyen szövegen és hangnemen keresztül.
-
3
Írja be a szöveget
Írja be vagy illessze be a kívánt szkriptet a klónozott hang. OpenVoice támogatja körülbelül 10 nyelven és több nyelven szállítás, így lehet írni egy másik nyelven, mint a referencia klip.
-
4
Válasszon egy hangstílust és generáljon
Válasszon egyet a kilenc OpenVoice hangstílus közül - alapértelmezett, barátságos, vidám, izgatott, szomorú, dühös, rémült, kiabáló vagy suttogó - majd generál. Ugyanaz a klónozott hang fog beszélni az érzelmi szülés.
-
5
Az API letöltése vagy használata
Töltse le a hang MP3, WAV, vagy OGG, vagy automatizálja generáció keresztül a TextToSpeechAI API át a klónozott hang és hangstílus minden kérés.
OpenVoice API
A beszéd programszerű generálása a TextToSpeechAI REST API használatával.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Az OpenVoice bármilyen hangon tud beszélni \u002D vidáman, szomorúan vagy akár suttogva is.",
"voice": "en_US-lessac-medium"
}'
Gyakran ismételt kérdések
Technical Specs
- Generation Speed Moderate
- Output Quality Very Good
- Voice Cloning Supported
- Languages 10
- GPU VRAM 3-6GB
- Credits/1000 chars 50