OpenVoice

Ultra

Kiirhääle kloonimine Granular Tone Control'iga

Moderate Kiirus
Very Good Kvaliteet
Jah Kloonimine
10 Keeled

Info OpenVoice

OpenVoice on mitmekülgne kohene hääl kloonimise mudel, mis võimaldab peeneteralist kontrolli rääkimisstiili üle. Erinevalt teistest kloonimismudelitest eraldab OpenVoice häälidentiteeti rääkimisest, võimaldades teil võtta kloonitud hääle ja rakendada erinevaid toone - rõõmsaid, kurbi, vihaseid, põnevaid või sosinaid - ilma uue viitehelita.

Peamised omadused

Instant Cloning

Kloon iga hääl vaid mõne sekundi heli.

Tooni kontroll

Rakenda rõõmsat, kurba, vihast, erutatud või sosinat tooni.

Stiiliülekanne

Eraldi hääleidentiteet rääkimisstiilist paindlikkuse huvides.

Piiriülene

Kasutada kloonitud hääli erinevates keeltes.

Kiire töötlemine

Tõhus järeldus kiire hääl põlvkonna.

Avatud lähtekoodiga

MIT on litsentseeritud kaubanduslikeks rakendusteks.

Kasutusklassid

Emotsionaalne sisu Märkide animatsioon Interaktiivsed mängud Audioraamat Narration Turundusvideod Virtuaalsed abilised

Kuidas kasutada OpenVoice

  1. 1

    Registreeru tasuta või proovi demo

    Loo tasuta TextToSpeechAI konto saada starter krediiti, või kasutada on-lehekülje demo kuulda OpenVoice enne kohustuse võtmist. Ei ole kohalik GPU või installida on vaja - kõik töötab meie serverid.

  2. 2

    Vali OpenVoice ja laadi üles viiteklipp

    Vali OpenVoice' i mootor, seejärel laadi üles paar sekundit puhast viiteheli, et sihtmärgi hääl koheselt kloonida. OpenVoice salvestab kõneleja identiteedi, nii et seda saab uuesti kasutada iga teksti ja tooni puhul.

  3. 3

    Sisesta oma tekst

    Kirjuta või aseta skript, mida soovid kloonitud hääles kõnelda. OpenVoice toetab umbes 10 keelt ja keeleülest tarnet, nii et sa võid kirjutada muus keeles kui viiteklipp.

  4. 4

    Vali tooni stiil ja genereeri

    Valige üks üheksast OpenVoice tooni stiilist - vaikimisi, sõbralik, rõõmsameelne, erutatud, kurb, vihane, hirmunud, karjuv või sosin - siis tekitame. Sama kloonitud hääl räägib selle emotsionaalse tarnega.

  5. 5

    API allalaadimine või kasutamine

    Lae oma audio nagu MP3, WAV, või OGG, või automate põlvkonna kaudu TextToSpeechAI API, andes oma kloonitud hääl ja toon stiilis iga taotluse.

OpenVoice API

Loo kõne programmiliselt kasutades TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice võib rääkida ükskõik millises toonis \u002D rõõmsas, kurvas või isegi sosistamises.",
    "voice": "en_US-lessac-medium"
  }'

Korduma kippuvad küsimused

OpenVoice on täiustatud tekstilt kõnele ja hääle kloonimise mudel, mis eristab häälidentiteeti ainulaadselt rääkivast stiilist. See võimaldab kloonida hääle ja seejärel rakendada erinevaid emotsionaalseid helisid, ilma et iga emotsiooni jaoks oleks vaja uut viiteheli. See on ehitatud väljendusrikkale ja kontrollitavale kõne genereerimisele.

Jah, OpenVoice sooritab kohese hääl kloonimise vaid mõne sekundi heli - treeningut ei ole vaja. Kui hääl on salvestatud, OpenVoice saab taaskasutada seda identiteeti üle iga teksti ja iga tooni stiili valid.

OpenVoice kasutab kaheastmelist arhitektuuri, mis jagab põhikõne sünteesi tooni konversioonist. Pärast hääle kloonimist on võimalik rakendada mis tahes 9 tooni stiili - vaikimisi, sõbralik, rõõmsameelne, erutatud, kurb, vihane, hirmunud, karjuv või sosistav - ning sama kloonitud hääl kõneleb sinu valitud toonil erinevalt ilma uuesti salvestamata.

OpenVoice toetab üheksat kõnestiili: vaikimisi, sõbralik, rõõmsameelne, erutatud, kurb, vihane, hirmunud, karjuv ja sosistamine. Iga stiil kujundab ümber emotsionaalse tarne, säilitades kloonitud kõlari identiteedi, andes teile täpse kontrolli selle üle, kuidas rida loetakse.

OpenVoice on avatud lähtekoodiga lubatud MIT litsents, nii et see on tasuta kaubanduslikuks kasutamiseks. Nagu iga kloonimise mudel, veenduge, et teil on nõuetekohased õigused iga hääl te kloonida äriprojektide.

OpenVoice toetab umbes 10 keelt, sealhulgas inglise, hiina, jaapani, korea ja mitmeid Euroopa keeli. Samuti pakub see keeleülest kloonimist, nii et saate kloonida hääl ühes keeles ja on see räägib loomulikult teises.

OpenVoice on mõõduka põlvkonna kiirus, tavaliselt muutes lause 2-4 sekundit GPU. Väljundi kvaliteet on väga hea, selge hääl reprodutseerimise ja tooni ülekanne, mis hoiab kõneleja identiteeti puutumatu, muutes samal ajal veenvalt emotsionaalne tarne.

OpenVoice tavaliselt nõuab 6-8GB VRAM sõltuvalt partii suurus ja toon konverteerimise koormus. See töötab mugavalt keskele ülemine keskala GPU, ja TextToSpeechAI kõik see on käsitletud meie serverid, nii et sa ei vaja ühtegi kohalikku riistvara.

OpenVoice on Ultra-tier mootor, mille hind on 50 krediiti 1000 tähemärgi kohta. Ultra tasand peegeldab oma täiustatud tooni kontrolli ja täiendavat arvutust, mis on vajalik kloonimise pluss stiili muutmise torujuhtme jaoks.

OpenVoice on ainulaadne oma tooni ja stiili kontrolli: võite võtta ühe kloonitud hääl ja taasesitada selle rõõmsameelne, kurb, vihane, või sosistamine. F5-TTS on kiirem ja on meie vaikimisi kloonimise mootor loomulik, neutraalne kõne. Vali OpenVoice, kui vajate emotsionaalse stiili kontrolli, ja F5-TTS, kui soovite kiireim looduslik kloon.

Loo kloonitud hääl üleslaadimine viide heli, seejärel määrata toon stiilis oma API taotluse. API rakendab oma valitud emotsionaalne toon kloonitud hääl automaatselt ja tagastab heli MP3, WAV, või OGG formaadis.

Jah. Registreeru tasuta TextToSpeechAI konto saada starter krediiti ja proovige OpenVoice kloonimine ja toon kontroll, või kasutada on-lehekülje demo esimene. Ei ole kohalik setup - üles laadida viiteklipp, valida toon, ja luua brauseris.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free