OpenVoice

Ultra

Momentāra balss klonēšana ar granulu toņu kontroli

Moderate Ātrums
Very Good Kvalitāte
Klonēšana
10 Valodas

Par OpenVoice

OpenVoice ir daudzpusīgs, momentisks balss klonēšanas modelis, kas ļauj precīzi kontrolēt runātāju stilu. Atšķirībā no citiem klonēšanas modeļiem OpenVoice atdala balss identitāti no runāšanas stila, ļaujot jums izmantot klonētu balsi un pielietot dažādus toņus - jautru, skumju, dusmīgu, sajūsminātu vai čukstošu - bez jaunas atsauces audio.

Galvenās iezīmes

Akimirklī klonēšana

Apklāj jebkuru balsi no pāris sekundēm audio.

Toņu kontrole

Piesakies jautriem, skumjiem, dusmīgiem, sajūsminātiem vai čukstošiem toņiem.

Stils pārsūtīšana

Atsevišķa balss identitāte no runāšanas stila elastības.

Krusteniskā

Izmanto klonētas balsis dažādās valodās.

Ātrā apstrāde

Efektīva iedoma ātrai balss ģenerēšanai.

Atvērt avotu

MIT licencēts komerciāliem lietojumiem.

Lietot gadījumus

Emocionālais saturs Rakstzīmju animācija Interaktīvās spēles Audiogrāmatu narācija Mārketinga video Virtuālie palīgi

Kā lietot OpenVoice

  1. 1

    Pierakstīties bezmaksas vai mēģināt demo

    Izveidot bezmaksas TextToSpeechAI kontu, lai saņemtu startera kredītus, vai izmantot uz lapas demo, lai dzirdētu OpenVoice pirms saistību. Nav lokāla GPU vai instalēt ir nepieciešams - viss darbojas uz mūsu serveriem.

  2. 2

    Izvēlieties OpenVoice un augšupielādējiet uzziņu klipu

    Izvēlieties OpenVoice dzinēju, pēc tam augšupielādējiet dažas sekundes tīras atsauces audio, lai uzreiz klonētu mērķa balsi. OpenVoice uztver skaļruni, lai jūs varētu to atkārtoti izmantot jebkurā tekstā un tonī.

  3. 3

    Ievadiet tekstu

    Ierakstiet vai ielīmējiet skriptu, kuru vēlaties runāt klonētā balsī. OpenVoice atbalsta aptuveni 10 valodas un transling-lingvistic piegādi, lai jūs varētu rakstīt citā valodā nekā atsauces klipu.

  4. 4

    Izvēlieties toni stilu un ģenerējiet

    Izvēlieties vienu no deviņiem OpenVoice toņa stilu - noklusējuma, draudzīgs, jautrs, sajūsmā, skumji, dusmīgs, baiļu, kliedzot, vai čukstot - tad ģenerēs. Tā pati klonētā balss runās ar šo emocionālo piegādi.

  5. 5

    Lejupielādēt vai izmantot API

    Lejupielādēt savu audio kā MP3, WAV, vai OGG, vai automatizēt ģenerēt caur TextToSpeechAI API, izejot jūsu klonētu balsi un toņu stilu katrā pieprasījumā.

OpenVoice API

Ģenerēt runas programmēti, izmantojot TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice var runāt jebkurā tonī \u002D jautrs, skumjš, vai pat čukstēšana.",
    "voice": "en_US-lessac-medium"
  }'

Bieži uzdoti jautājumi

OpenVoice ir uzlabots teksta-to-speech un balss klonēšanas modelis, kas unikāli atdala balss identitāti no runājošā stila. Tas ļauj klonēt balsi un pēc tam izmantot dažādus emocionālus toņus bez jaunas atsauces audio katrai emocijai. Tas ir veidots izteiksmīgai, kontrolējamai runas paaudzei.

Jā, OpenVoice veic akimirklīgu balss klonēšanu tikai no dažām sekundēm uzziņas audio - mācību palaist nav nepieciešams. Pēc balss notveršanas OpenVoice var atkārtoti izmantot šo identitāti jebkurā tekstā un jebkurā toņa stilā, ko izvēlējies.

OpenVoice izmanto divu posmu arhitektūru, kas sadala bāzes runas sintēzi no toņa konversijas. Pēc balsī klonēšanas jūs varat izmantot jebkuru no 9 toņu stiliem - noklusējuma, draudzīgs, jautrs, sajūsmā, skumji, dusmīgs, baiļrunīgs, kliedzošs, vai čukstošs - un pati klonētā balss runā atšķirīgi, pamatojoties uz jūsu izvēlēto toni bez atkārtotas ierakstīšanas.

OpenVoice atbalsta deviņus runājošus stilus: noklusējuma, draudzību, jautrību, sajūsmu, skumju, dusmīgu, šausmu, kliedzienu un čukstēšanu. Katrs stils pārformē emocionālo piegādi, vienlaikus saglabājot klonētu skaļruni, dodot jums smalki graudainu kontroli pār to, kā līnijas lasa.

OpenVoice ir atvērts avots saskaņā ar atļauju MIT, tāpēc tas ir bezmaksas komerciālai lietošanai. Tāpat kā ar jebkuru klonēšanas modeli, pārliecinieties, ka jums ir tiesības uz jebkuru balsi, kuru jūs klonēt komerciālos projektos.

OpenVoice atbalsta aptuveni 10 valodas, tostarp angļu, ķīniešu, japāņu, korejiešu un vairākas Eiropas valodas. Tā piedāvā arī multilingvālu klonēšanu, lai jūs varētu klonēt balsi vienā valodā un lai tā dabiski runā citā valodā.

OpenVoice ir mērens paaudzes ātrums, parasti padarot teikumu 2-4 sekundēs par GPU. Izvades kvalitāte ir ļoti laba, ar skaidru balss reproducēšanu un toņu pārnesi, kas saglabā skaļrunis identitāti neskartu, vienlaikus pārliecinoši mainot emocionālo piegādi.

OpenVoice parasti prasa 6-8GB VRAM atkarībā no partijas izmēra un toņa konversijas slodze. Tas darbojas ērti uz vidus diapazona līdz vidēja diapazona augšējām GPU, un uz TextToSpeechAI tas viss tiek apstrādāti uz mūsu serveriem, tāpēc jums nav nepieciešama nekāda vietējā aparatūra.

OpenVoice ir Ultra līmeņa motors, kam tiek maksāts 50 kredītpunkti par 1000 zīmēm. Ultralīmeņa līmenis atspoguļo tā uzlaboto toņa kontroli un papildu aprēķinu, kas nepieciešams klonēšanas un stila konversijas cauruļvadam.

OpenVoice ir unikāls tās tonim un stila kontrolei: jūs varat veikt vienu klonētu balsi un atkārtoti piegādāt to kā jautru, skumju, dusmīgu vai čukstējošu. F5-TTS ir ātrāks un ir mūsu noklusētais klonēšanas dzinējs dabiskai, neitrālai runai. Izvēlieties OpenVoice, kad jums ir nepieciešama emocionālā stila kontrole, un F5-TTS, kad jūs vēlaties ātrākais dabas klons.

Izveidot klonētu balsi, augšupielādējot atsauces audio, pēc tam norādīt toņa stilu savā API pieprasījumā. API automātiski piemēro jūsu izvēlēto emocionālo toni klonētajai balss joslai un atgriež audio MP3, WAV vai OGG formātā.

Pieteikties bezmaksas TextToSpeechAI kontu, lai saņemtu startera kredītus un mēģināt OpenVoice klonēšanu un toņa kontroli, vai izmantot on-lapas demo vispirms. Nav lokāla iestatīšana - augšupielādēt atsauces klipu, izvēlēties toni, un radīt pārlūkprogrammā.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free