OpenVoice

Ultra

Inchidere instantaneu cu tone granulare control

Moderate Viteza
Very Good Calitate
Da. Clonarea
10 Limbi

Despre OpenVoice

OpenVoice este un model de clonare instantă a vocii versatilă care permite controlul înclinat fin asupra stilului de vorbire. Spre deosebire de alte modele de clonare, OpenVoice separa identitatea vocală de stil de vorbire, permițându-vă să luați o voce clonată și aplicați tonuri diferite - vesel, trist, furios, entuziasmat, sau șoptit - fără audio de referință nou.

Caracteristici cheie

Inchidere instantaneu

Clonează orice voce de la doar câteva secunde de audio.

Controlul tonelor

Aplicaţi tonuri vesel, trist, supărat, încântat sau şoapte.

Transferul stilului

Separarea identitatea vocală de stilul de vorbire pentru flexibilitate.

Lingual-cross

Foloseşte voci clonate în diferite limbi.

Prelucrare rapidă

Eficientă inferenţă pentru generarea rapidă a vocii.

Sursă deschisă

MIT licențiat pentru cereri comerciale.

Cazuri de utilizare

Conținut emoțional Animație caractere Jocuri interactive Narație audiobook Videoclipuri de marketing Asistenți virtuali

Cum să utilizaţi OpenVoice

  1. 1

    Inregistrează-te gratuit sau încercați demo

    Creați un cont gratuit de TextToSpeechAI pentru a obține credite de pornire, sau folosiți demo de pe pagina pentru a auzi OpenVoice înainte de a comite. Nu este nevoie de GPU local sau instalare - totul se rulează pe serverele noastre.

  2. 2

    Alege OpenVoice și încărcă un clip de referință

    Selectați motorul OpenVoice, apoi încărcarea câteva secunde de audio de referință curată pentru a clona instantaneu vocea țintă. OpenVoice captă identitatea vorbitorului astfel încât să-l puteți reutiliza pe orice text și ton.

  3. 3

    Introduceți textul

    Scrie sau încolți scriptul pe care doriți să îl vorbiți în voce clonată. OpenVoice suportă aproximativ 10 limbi și livrare încrucișată, astfel încât să puteți scrie într-o limba diferită de clipul de referință.

  4. 4

    Alege un stil de ton și genera

    Alege unul dintre cele nouă stiluri de ton OpenVoice - implicit, prietenos, vesel, entuziasmat, trist, furios, îngrozit, strigând sau şoapte - apoi generează. Aceeaşi voce clonată va vorbi cu acea livrare emoţională.

  5. 5

    Descărcați sau folosiți API

    Descarcă audioul ca MP3, WAV, sau OGG, sau automatizează generația prin TextToSpeechAI API prin trecerea vocei și ton clonate în fiecare cerere.

OpenVoice API

Generați discursul programmatic folosind API TextToSpeechAI REST.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice poate vorbi în orice ton \u002D vesel, trist sau chiar şoapte.",
    "voice": "en_US-lessac-medium"
  }'

Întrebări frecvente

OpenVoice este un model avansat de clonare de text la voce care separa unic identitatea vocală de stilul de vorbire. Aceasta vă permite clonarea unei voci și apoi aplica diferite tonuri emoționale fără a avea nevoie de un nou audio de referință pentru fiecare emoție. Este construit pentru generarea expresivă, controlabilă de vorbire.

Da, OpenVoice efectuează clonarea instantană a vocii de la doar câteva secunde de audio de referință - nici un run de antrenament necesar. Odată ce o voce este captata, OpenVoice poate reutiliza această identitate în orice text și orice stil de ton alegeți.

OpenVoice folosește o arhitectură de două etape care divizează sinteza de vot de bază de la conversia tonului. După clonarea unei voci, puteți aplica oricare dintre cele 9 stiluri de ton - implicit, prietenos, vesel, emoționat, trist, furios, îngrozit, strigând sau șoapte - și aceeași voce clonată vorbește diferit bazat pe tonul ales fără re-enregistrare.

OpenVoice suportă nouă stiluri de vorbire: implicite, prietenoase, veseli, entuziasmate, triste, furioase, îngrozite, strigând, şoapte. Fiecare stil reformează livrarea emoţională în timp ce menţine identitatea de vorbitor clonat, oferind control fin-grained asupra modului în care se citi o linie.

OpenVoice este open-source sub permisiune de licență MIT, așa că este gratuit pentru utilizare comercială. Ca și cu orice model de clonare, asigurați-vă că aveți drepturile adecvate pentru orice voce clonați pentru proiecte comerciale.

OpenVoice suportă aproximativ 10 limbi, inclusiv engleză, chineză, japoneză, coreeană şi mai multe limbi europene. Oferă, de asemenea, clonare translinică, astfel încât să poți clona o voce într-o limbă și să-l vorbească în mod natural în altă limbă.

OpenVoice are viteza de generare moderata, de obicei randând o sentință în 2-4 secunde pe o GPU. Calitatea de ieșire este foarte bună, cu reproducere vocală clară și transfer de ton care menține identitatea speaker intacte în timp ce schimba convingător livrarea emoțională.

OpenVoice necesită de obicei 6-8GB de VRAM în funcţie de dimensiunea lotului şi de sarcina de conversie a tonurilor. Se funcționează confortabil pe intervalul mijloc până la nivelul de sus GPU-uri de rang mediu, iar pe TextToSpeechAI toate acestea sunt gestionate pe serverele noastre astfel încât să nu aveţi nevoie de hardware-uri locale.

OpenVoice este un motor ultra-tier, preţ cu 50 de credite pe 1000 de caractere. Nivelul Ultra reflectă controlul său avansat al tonului şi calculul suplimentar necesar pentru clonarea plus conversie stilului conductei.

OpenVoice este unic pentru tonul și controlul său de stil: puteți lua o voce clonată și re-entrega ca vesel, trist, supărat, sau șoapte. F5-TTS este mai rapid și este motorul nostru de clonare implicit pentru discursul natural, neutru. Alege OpenVoice atunci când aveți nevoie de control emoțional, și F5-TTS atunci când doriți clona naturală mai rapid.

Creați o voce clonată prin încărcarea audio de referință, apoi specificați un stil de ton în cererea API. API aplica tonul emoțional ales la voce clonat automat și returnează audio în format MP3, WAV sau OGG.

Da. Înregistrează-te pentru un cont gratuit de TextToSpeechAI pentru a primi credite de pornire și încercați să-l controlați pe OpenVoice și tone control, sau utilizați prima demo de pe pagina. Nu există configurație locală - încărcați un clip de referință, alegeți un ton, și generați în browser.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free