OpenVoice

Ultra

Azonnali hang klónozás Granular Tone vezérlés

Moderate Sebesség
Very Good Minőség
Igen. Klónozás
10 Nyelvek

About OpenVoice

Az OpenVoice egy sokoldalú, azonnali hang klónozási modell, amely finomra vésett irányítást tesz lehetővé a beszédstílus felett. Ellentétben más klónozó modellekkel, az OpenVoice elválasztja a hangazonosságt a beszédstílustól, lehetővé teszi, hogy klónozott hangot vegyen fel és különböző hangokat alkalmazzon - vidám, szomorú, dühös, izgatott vagy suttogó - új referencia hangzás nélkül.

Kulcsfontosságú jellemzők

Azonnali klónozás

Klón bármilyen hang néhány másodpercnyi hang.

Tónusos vezérlés

Vidám, szomorú, dühös, izgatott vagy suttogó hangokat alkalmaz.

Stílusátvezetés

A hangazonosság és a beszédstílus közötti különbség a rugalmasság érdekében.

Keresztirányban

Használj klónozott hangokat különböző nyelveken.

Gyors feldolgozás

Hatékony következtetés a gyors hangnemhez.

Nyílt forrás

MIT kereskedelmi alkalmazásokra.

Esetek használata

Érzelmi tartalom Jellemzés Interaktív játékok Hangkönyv Narration Marketing videók Virtuális asszisztensek

Hogyan kell alkalmazni? OpenVoice

  1. 1

    Regisztráljon ingyen vagy próbálja ki a demót

    Hozzon létre egy ingyenes TextToSpeechAI fiókot, hogy starter krediteket kapjon, vagy használja a honlapon megjelenő demót az OpenVoice meghallgatására, mielőtt elkötelezné magát. Helyi GPU vagy telepítés nem szükséges - minden a szervereinken fut.

  2. 2

    Válassza az OpenVoice-t és töltsön fel egy referenciaklipet

    Válassza ki az OpenVoice motort, majd töltsön fel pár másodperc tiszta referencia audiót, hogy azonnal klónozza a célhangot. Az OpenVoice rögzíti a hangszóró személyazonosságát, így újra fel tudja használni bármilyen szövegen és hangnemen keresztül.

  3. 3

    Írja be a szöveget

    Írja be vagy illessze be a kívánt szkriptet a klónozott hang. OpenVoice támogatja körülbelül 10 nyelven és több nyelven szállítás, így lehet írni egy másik nyelven, mint a referencia klip.

  4. 4

    Válasszon egy hangstílust és generáljon

    Válasszon egyet a kilenc OpenVoice hangstílus közül - alapértelmezett, barátságos, vidám, izgatott, szomorú, dühös, rémült, kiabáló vagy suttogó - majd generál. Ugyanaz a klónozott hang fog beszélni az érzelmi szülés.

  5. 5

    Az API letöltése vagy használata

    Töltse le a hang MP3, WAV, vagy OGG, vagy automatizálja generáció keresztül a TextToSpeechAI API át a klónozott hang és hangstílus minden kérés.

OpenVoice API

A beszéd programszerű generálása a TextToSpeechAI REST API használatával.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Az OpenVoice bármilyen hangon tud beszélni \u002D vidáman, szomorúan vagy akár suttogva is.",
    "voice": "en_US-lessac-medium"
  }'

Gyakran ismételt kérdések

OpenVoice egy fejlett szöveg-beszélő és hang klónozó modell, amely egyedülállóan elválasztja a hang identitást a beszéd stílus. Ez lehetővé teszi, hogy klónozza a hangot, majd alkalmazza a különböző érzelmi hangok nélkül szükség van új referencia hang minden érzelem. Ez épült kifejező, irányítható beszéd generáció.

Igen, az OpenVoice azonnali hang klónozást végez néhány másodpercnyi referencia-hangból - nincs szükség kiképzésre. Ha egyszer egy hang elfog, az OpenVoice újra tudja használni ezt az identitást bármilyen szövegen és bármilyen hangstíluson keresztül, amit kiválaszt.

OpenVoice egy kétlépcsős architektúrát használ, amely a hangkonverziótól megosztja a beszédalapú szintézist. A hang klónozása után a 9 hangstílus bármelyikét alkalmazhatja - alapértelmezett, barátságos, vidám, izgatott, szomorú, dühös, rémült, ordító vagy suttogó - és ugyanez a klónozott hang máshogy beszél a választott hangszíned alapján anélkül, hogy újra felvetted volna.

OpenVoice támogatja kilenc beszédstílus: alapértelmezett, barátságos, vidám, izgatott, szomorú, dühös, rémült, kiabáló és suttogó. Minden stílus átformálja az érzelmi szülést, miközben megőrzi a klónozott hangszóró identitását, finoman irányítva a sor olvasását.

Az OpenVoice nyílt forráskódú az engedélyezett MIT licenc alatt, így kereskedelmi használatra is ingyenes. Mint minden klónozási modell esetében, győződjön meg róla, hogy megfelelő jogokkal rendelkezik minden olyan hanghoz, amelyet kereskedelmi projektekhez klónoz.

Az OpenVoice körülbelül 10 nyelvet támogat, köztük angol, kínai, japán, koreai és több európai nyelvet. A többnyelvű klónozást is kínálja, így egy hang klónozható egy nyelven, és természetesen beszélhet egy másik nyelven.

OpenVoice mérsékelt generációs sebesség, jellemzően egy mondat 2-4 másodperc alatt egy GPU. Kimeneti minőség nagyon jó, világos hang reprodukció és hangátvitel, amely tartja a hangszóró identitás érintetlen, miközben meggyőzően változó érzelmi szállítás.

OpenVoice jellemzően 6-8GB VRAM-ot igényel a gyártási mérettől és a hangkonverziós terheléstől függően. Kényelmesen fut a közép- és felső-középkategóriás GPU-kon, és TextToSpeechAI-en mindezt a szervereinken kezeljük, így nincs szükség helyi hardverre.

Az OpenVoice egy Ultra-tier motor, ára 50 kredit 1000 karakterenként. Az Ultra-szint tükrözi a fejlett hangvezérlést és a klónozáshoz szükséges extra komputert, valamint a stílusváltáshoz szükséges vezetéket.

OpenVoice egyedülálló a hang és stílus vezérlése: akkor lehet venni egy klónozott hang, és újra kézbesíteni, mint vidám, szomorú, dühös, vagy suttogás. F5-TTS gyorsabb, és az alapértelmezett klónozó motor a természetes, semleges beszéd. Válassza OpenVoice, amikor szükség van érzelmi stílus vezérlés, és F5-TTS, ha azt szeretnénk, hogy a leggyorsabb természetes klón.

Hozzon létre egy klónozott hangot referencia audio feltöltésével, majd adjon meg egy hangstílust az API kérésében. Az API automatikusan alkalmazza a választott érzelmi hangot a klónozott hangra, és MP3, WAV vagy OGG formátumban adja vissza az audiót.

Igen. Regisztráljon ingyenes TextToSpeechAI fiókot, hogy megkapja az indító krediteket, és próbálja meg az OpenVoice klónozást és hangvezérlést, vagy először használja a honlapon megjelenő demót. Helyi beállítás nem létezik - töltsön fel egy referenciacsipeszt, válasszon egy hangot, és generáljon a böngészőben.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free