OpenVoice

Ultra

Momentinė balso klonavimas su granuliuoto tono kontrole

Moderate Greitis
Very Good Kokybė
Taip Klonavimas
10 Kalbos

Apie OpenVoice

OpenVoice yra universalus akimirkinis balso klonavimo modelis, leidžiantis tiksliai kontroliuoti kalbėjimo stilių. Priešingai nei kiti klonavimo modeliai, OpenVoice atskiria balso tapatybę nuo kalbėjimo stiliaus, leidžia priimti klonuotą balsą ir taikyti skirtingus tonus - linksmą, liūdną, piktą, susijaudintą, ar šnibždą - be naujos nuorodos garso.

Pagrindinės savybės

Greitas klonavimas

Uždenk bet kokį balsą iš vos kelių sekundžių garso.

Tono kontrolė

Taikyti linksmas, liūdna, piktas, susijaudinęs, arba šnibžda tonai.

Stilius perdavimas

Atskiras balso tapatumas nuo kalbėjimo stiliaus lankstumo.

Kryžminės kalbos

Naudoti klonuoti balsai įvairiomis kalbomis.

Greitas apdorojimas

Veiksmingas bandymas greitai balso generavimui.

Atverti šaltinį

MIT licencija, išduota komerciniams tikslams.

Naudoti atvejus

Emocinis turinys Simbolių animacija Interaktyvių žaidimų Garso knygos naracija Rinkodaros vaizdo įrašai Virtualios pagalbinės priemonės

Kaip vartoti OpenVoice

  1. 1

    Užsiregistruoti nemokamai arba išbandyti demo

    Sukurti nemokamą TextToSpeechAI paskyrą, kad gautumėte starterio kreditus, arba naudoti į puslapį demo išgirsti OpenVoice prieš darant. Nėra vietos GPU ar įdiegti nereikia - viskas veikia mūsų serveriuose.

  2. 2

    Pasirinkite OpenVoice ir įkelkite informacinius klipus

    Pasirinkite OpenVoice variklį, tada įkelkite keletą sekundžių švarios nuorodos garso nedelsiant klonuoti tikslinės balso. OpenVoice fiksuoja garsiakalbio tapatybę, kad galėtumėte jį pakartotinai naudoti bet kuriame tekste ir tone.

  3. 3

    Įveskite savo tekstą

    Įveskite arba įklijuokite scenarijų, kurį norite kalbėti klonuotame balso. OpenVoice palaiko apie 10 kalbų ir kryžminio pristatymo, todėl galite parašyti kita kalba nei informacinis klipas.

  4. 4

    Pasirinkite toną stilių ir generuoti

    Pasirinkite vieną iš devynių OpenVoice tonas stilius - numatytasis, draugiškas, linksmas, susijaudinęs, liūdna, piktas, baisus, šauksmas, ar šnibžda - tada generuoti. Tas pats klonuotas balsas kalbės su tuo emocinis pristatymas.

  5. 5

    Atsisiųsti arba naudoti API

    Atsisiųskite savo garso MP3, WAV, arba OGG, arba Automate generaciją per TextToSpeechAI API, praleidžiant jūsų klonuotas balsas ir tonas stilius pagal kiekvieną užklausą.

OpenVoice API

Generuoti kalbos programuoja naudojant TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice gali kalbėti bet kuriuo tonu \u002D linksmas, liūdna, ar net šnabžda.",
    "voice": "en_US-lessac-medium"
  }'

Dažnai užduodami klausimai

OpenVoice yra pažangus teksto-į-giešį ir balso klonavimo modelis, kuris unikaliai atskiria balso tapatybę nuo kalbėjimo stiliaus. Tai leidžia klonuoti balsą ir tada pritaikyti skirtingus emocinius tonus be naujų nuorodų garso kiekvienai emocijai. Jis yra sukurtas išraiškingai, valdomai kalbėjimo generacijai.

Taip, OpenVoice atlieka akimirkinį balso klonavimą vos iš kelių sekundžių atskaitos garso - nereikia treniruočių. Kai balsas yra užfiksuotas, OpenVoice gali pakartotinai naudoti tą tapatybę per bet kokį tekstą ir bet kokį tono stilių, kurį pasirinkote.

OpenVoice naudojama dviejų pakopų architektūra, kuri padalija pagrindinės kalbos sintezę iš tono konversijos. Po klonavimo balsą galite taikyti bet kurį iš 9 tonų stilių - numatytą, draugišką, linksmą, susijaudinusį, liūdną, piktą, baisų, šauksmą ar šnibždą - ir tas pats klonuotas balsas kalba skirtingai, remiantis jūsų pasirinktu tonu be naujo įrašymo.

OpenVoice palaiko devynis kalbėjimo stilius: numatytoji, draugiškas, linksmas, susijaudinęs, liūdna, pikta, baisi, šauksmas, ir šnibžda. Kiekvienas stilius performamentuoja emocinį pristatymą, tuo pat metu išsaugant klonuotas garsiakalbio tapatybę, suteikiant jums smulkiai graviūruotą kontrolę, kaip linija yra skaitoma.

OpenVoice yra atviras šaltinis pagal leidžiamo MIT licencijos, todėl jis yra nemokamas komerciniam naudojimui. Kaip ir bet koks klonavimo modelis, įsitikinkite, kad turite tinkamas teises į bet kokį balsą jūs klonuoti komerciniams projektams.

OpenVoice palaiko apie 10 kalbų, įskaitant anglų, kinų, japonų, korėjiečių ir kelių Europos kalbų. Ji taip pat siūlo tarpkalbinį klonavimą, todėl galite klonuoti balsas viena kalba ir ji turi kalbėti natūraliai kitoje.

OpenVoice turi vidutinio kartos greitis, paprastai per 2-4 sekundes pateikiant sakinį GPU. Išvesties kokybė yra labai gera, su aiškiu balso atkūrimo ir tono perdavimo, kuris išlaiko garsiakalbio tapatybę nepakitęs, o įtikinamai keičiasi emocinis pristatymas.

OpenVoice paprastai reikalauja 6-8GB VRAM priklausomai nuo serijos dydžio ir tono konversijos apkrovos. Jis veikia patogiai nuo vidutinio iki viršutinės vidutinės klasės GPU, ir TextToSpeechAI visa tai yra tvarkomi mūsų serveriuose, todėl jums nereikia jokios vietinės įrangos.

OpenVoice yra ultraaukštos kokybės variklis, kurio kaina yra 50 kreditų už 1000 ženklų. Ultra pakopa atspindi jo pažangų tono kontrolę ir papildomą komplaciją, reikalingą klonavimo ir stiliaus-konversijos vamzdynui.

OpenVoice yra unikalus savo tonuso ir stiliaus valdymo: galite priimti vieną klonuotą balso ir iš naujo pristatyti jį kaip linksmas, liūdna, piktas, ar šnabžda. F5-TTS yra greičiau ir yra mūsų numatytasis klonavimo variklis natūraliai, neutrali kalba. Pasirinkite OpenVoice, kai jums reikia emocinio stiliaus kontrolės, ir F5-TTS, kai norite greičiausias gamtos klonas.

Sukurti klonuotą balsą įkeliant nuorodos garsą, tada nurodyti tono stilių API prašyme. API automatiškai pritaiko pasirinktą emocinį toną klonuotam balsui ir grąžina garsą MP3, WAV arba OGG formatu.

Taip. Užsiregistruoti nemokamai TextToSpeechAI paskyros gauti starterio kreditus ir išbandyti OpenVoice klonavimo ir tono kontrolę, arba naudoti on-lapio demo pirmiausia. Nėra vietos sąranka - įkelti nuorodą klipas, pasirinkti toną, ir generuoti naršyklėje.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free