OpenVoice

Ultra

Pikaäänikloonaus ja rakeinen äänentoistolaite

Moderate Nopeus
Very Good Laatu
Kyllä Kloonaus
10 Kielet

Tietoja OpenVoice

OpenVoice on monipuolinen pikaäänikloonausmalli, joka mahdollistaa puhetyylin hienopiirteisen hallinnan. Toisin kuin muut kloonausmallit OpenVoice erottaa ääni-identiteetin puhetyylistä, jolloin voit ottaa kloonatun äänen ja käyttää erilaisia ääniä - iloisia, surullisia, vihaisia, innokkaita tai kuiskailevia - ilman uutta referenssiääntä.

Tärkeimmät ominaisuudet

Pikakloonaus

Kloonaaa minkä tahansa äänen vain muutamasta sekunnista.

Ääniohjaus

Käytä iloisia, surullisia, vihaisia, innokkaita tai kuiskaavia sävyjä.

Tyylisiirto

Erota ääni-identiteetti puhetyylistä joustavuuteen.

Ristiinlinnoitus

Käytä kloonattuja ääniä eri kielillä.

Nopea käsittely

Tehokas päätelmä nopealle äänisukupolvelle.

Avaa lähdekoodi

MIT-lupa kaupallisiin sovelluksiin.

Käytä tapauksia

Tunteellinen sisältö Hahmoanimaatio Interaktiiviset pelit Äänikirjan narratiivi Markkinointivideot Virtuaaliavustajat

Miten sitä käytetään OpenVoice

  1. 1

    Rekisteröidy ilmaiseksi tai kokeile demoa

    Luo ilmainen TextToSpeechAI-tili, jolla saat aloituskomennukset, tai käytä sivulla olevaa demoa kuullaksesi OpenVoicea ennen kuin sitoudut. Paikallista GPU:ta tai asennusta ei tarvita - kaikki toimii palvelimillamme.

  2. 2

    Valitse OpenVoice ja lataa viiteliitteen

    Valitse OpenVoice-moottori ja lataa sitten muutama sekunti puhdasta referenssiääntä, jotta kohdeääni voidaan välittömästi kloonata. OpenVoice vangitsee kaiuttimen identiteetin, jotta voit käyttää sitä uudelleen missä tahansa tekstissä ja sävyssä.

  3. 3

    Syötä teksti

    Kirjoita tai liitä skripti, jonka haluat puhua kloonatulla äänellä. OpenVoice tukee noin kymmentä kieltä ja rajat ylittävää toimitusta, joten voit kirjoittaa eri kielellä kuin viiteliitteen.

  4. 4

    Valitse äänityyli ja luo

    Valitse yksi yhdeksästä OpenVoice -tyylistä - oletus, ystävällinen, iloinen, innostunut, surullinen, vihainen, kauhuissaan, huutava tai kuiskaava - ja sitten luo. Sama kloonattu ääni puhuu tuon tunnelähetyksen kanssa.

  5. 5

    Lataa tai käytä API-rajapintaa

    Lataa äänesi MP3-, WAV- tai OGG-puhelimeksi tai automatisoi sukupolvi TextToSpeechAI API:n kautta välittämällä kloonoitu ääni- ja äänityylisi jokaiseen pyyntöön.

OpenVoice API

Luo puheohjelmallisesti TextToSpeechAI REST API:n avulla.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice voi puhua mihin tahansa sävyyn \u002D iloiseen, surulliseen tai jopa kuiskaavaan sävyyn.",
    "voice": "en_US-lessac-medium"
  }'

Usein kysyttyjä kysymyksiä

OpenVoice on kehittynyt tekstien ja äänen kloonausmalli, joka erottaa ääni-identiteetin ainutlaatuisesti puhetyylistä. Näin voit kloonata äänen ja käyttää sen jälkeen erilaisia tunneääniä tarvitsematta uutta referenssiääntä jokaiseen tunteeseen. Se on rakennettu ilmaisullista ja kontrolloitavaa puhesukupolvea varten.

Kyllä, OpenVoice suorittaa pikaäänikloonauksen vain muutaman sekunnin mittaisesta referenssiäänestä - harjoitusta ei tarvita. Kun ääni on saatu kiinni, OpenVoice voi käyttää tätä identiteettiä uudelleen missä tahansa teksteissä ja missä tahansa valitsemassasi sävytyylissä.

OpenVoice käyttää kaksivaiheista arkkitehtuuria, joka jakaa peruspuheen synteesin äänimuunnelmasta. Äänen kloonauksen jälkeen voit soveltaa mitä tahansa 9 sävyn tyyliä - oletustyyliä, ystävällisyyttä, iloisuutta, innostusta, surua, vihaa, kauhua, huutamista tai kuiskaamista - ja sama kloonattu ääni puhuu eri tavalla valitun äänensävyn perusteella ilman uusintaäänitystä.

OpenVoice tukee yhdeksää puhetyyliä: oletusta, ystävällistä, iloista, innokasta, surullista, vihaista, kauhuissaan olevaa, huutavaa ja kuiskailevaa. Jokainen tyyli muokkaa emotionaalista toimitusta säilyttäen samalla kloonatun puhujan identiteetin, antaen hienotunteisen hallinnan sille, miten riviä luetaan.

OpenVoice on avoin lähdekoodi sallivan MIT-lisenssin nojalla, joten se on vapaa kaupalliseen käyttöön. Kuten mikä tahansa kloonausmalli, varmista, että sinulla on asianmukaiset oikeudet kaikkiin ääniin, joita kloonaat kaupallisissa projekteissa.

OpenVoice tukee noin kymmentä kieltä, kuten englantia, kiinaa, japania, koreaa ja useita eurooppalaisia kieliä. Se tarjoaa myös ylikielistä kloonausta, joten äänen voi kloonata yhdellä kielellä ja antaa sen puhua luonnollisesti toisella kielellä.

OpenVoicen sukupolvinopeus on kohtalainen, ja se tekee lauseen yleensä 2-4 sekunnissa GPU:sta. Tuotoslaatu on erittäin hyvä, ja äänen toisto ja äänensiirto on selkeä, mikä pitää kaiuttimen identiteetin ennallaan ja muuttaa samalla vakuuttavasti emotionaalista toimitusta.

OpenVoice vaatii tyypillisesti 6-8GB VRAM-muistia riippuen erän koosta ja sävymuunnoskuormasta. Se toimii mukavasti keski- tai ylemmän keskialueen GPU:illa, ja TextToSpeechAI:lla kaikki tämä hoidetaan palvelimillamme, joten et tarvitse paikallisia laitteita.

OpenVoice on ultratasoinen moottori, jonka hinta on 50 krediittiä tuhatta merkkiä kohti. Ultra-taso heijastaa sen kehittynyttä ääniohjausta ja kloonaus- ja tyylimuunnosputkeen tarvittavaa ylimääräistä laskentaa.

OpenVoice on ainutlaatuinen äänensävynsä ja tyylinsä hallintaan: voit ottaa yhden kloonatun äänen ja toimittaa sen uudelleen iloisena, surullisena, vihaisena tai kuiskaavana. F5-TTS on nopeampi ja oletuskloonausmoottorimme luonnollista, neutraalia puhetta varten. Valitse OpenVoice, kun tarvitset emotionaalista tyylinhallintaa, ja F5-TTS, kun haluat nopeimman luonnollisen kloonin.

Luo kloonattu ääni lataamalla referenssiääni, määrittele sitten API-pyynnössäsi äänityyli. API soveltaa valitsemaasi emotionaalista sävyä kloonattuun ääneen automaattisesti ja palauttaa äänen MP3-, WAV- tai OGG-muodossa.

Kyllä. Rekisteröidy ilmaiseksi TextToSpeechAI-tilille saadaksesi aloituskomennuksen ja kokeillaksesi OpenVoice-kloonausta ja ääniohjausta tai käyttääksesi ensin sivun demoa. Paikallista ohjelmaa ei ole - lataa viitelippis, valitse ääni ja luo selaimeen.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free