OpenVoice

Ultra

Azonnali hang klónozás Granular Tone vezérlés

Próbálja ki a szabad OpenVoice Hangok böngészése (0)

Moderate Sebesség

Very Good Minőség

Igen. Klónozás

10 Nyelvek

About OpenVoice

Az OpenVoice egy sokoldalú, azonnali hang klónozási modell, amely finomra vésett irányítást tesz lehetővé a beszédstílus felett. Ellentétben más klónozó modellekkel, az OpenVoice elválasztja a hangazonosságt a beszédstílustól, lehetővé teszi, hogy klónozott hangot vegyen fel és különböző hangokat alkalmazzon - vidám, szomorú, dühös, izgatott vagy suttogó - új referencia hangzás nélkül.

Kulcsfontosságú jellemzők

Azonnali klónozás

Klón bármilyen hang néhány másodpercnyi hang.

Tónusos vezérlés

Vidám, szomorú, dühös, izgatott vagy suttogó hangokat alkalmaz.

Stílusátvezetés

A hangazonosság és a beszédstílus közötti különbség a rugalmasság érdekében.

Keresztirányban

Használj klónozott hangokat különböző nyelveken.

Gyors feldolgozás

Hatékony következtetés a gyors hangnemhez.

Nyílt forrás

MIT kereskedelmi alkalmazásokra.

Esetek használata

Érzelmi tartalom Jellemzés Interaktív játékok Hangkönyv Narration Marketing videók Virtuális asszisztensek

Hogyan kell alkalmazni? OpenVoice

1

Regisztráljon ingyen vagy próbálja ki a demót

Hozzon létre egy ingyenes TextToSpeechAI fiókot, hogy starter krediteket kapjon, vagy használja a honlapon megjelenő demót az OpenVoice meghallgatására, mielőtt elkötelezné magát. Helyi GPU vagy telepítés nem szükséges - minden a szervereinken fut.
2

Válassza az OpenVoice-t és töltsön fel egy referenciaklipet

Válassza ki az OpenVoice motort, majd töltsön fel pár másodperc tiszta referencia audiót, hogy azonnal klónozza a célhangot. Az OpenVoice rögzíti a hangszóró személyazonosságát, így újra fel tudja használni bármilyen szövegen és hangnemen keresztül.
3

Írja be a szöveget

Írja be vagy illessze be a kívánt szkriptet a klónozott hang. OpenVoice támogatja körülbelül 10 nyelven és több nyelven szállítás, így lehet írni egy másik nyelven, mint a referencia klip.
4

Válasszon egy hangstílust és generáljon

Válasszon egyet a kilenc OpenVoice hangstílus közül - alapértelmezett, barátságos, vidám, izgatott, szomorú, dühös, rémült, kiabáló vagy suttogó - majd generál. Ugyanaz a klónozott hang fog beszélni az érzelmi szülés.
5

Az API letöltése vagy használata

Töltse le a hang MP3, WAV, vagy OGG, vagy automatizálja generáció keresztül a TextToSpeechAI API át a klónozott hang és hangstílus minden kérés.

OpenVoice API

A beszéd programszerű generálása a TextToSpeechAI REST API használatával.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Az OpenVoice bármilyen hangon tud beszélni \u002D vidáman, szomorúan vagy akár suttogva is.",
    "voice": "en_US-lessac-medium"
  }'

API-fájlok olvasása Szerezd meg az API kulcsot

Gyakran ismételt kérdések

OpenVoice egy fejlett szöveg-beszélő és hang klónozó modell, amely egyedülállóan elválasztja a hang identitást a beszéd stílus. Ez lehetővé teszi, hogy klónozza a hangot, majd alkalmazza a különböző érzelmi hangok nélkül szükség van új referencia hang minden érzelem. Ez épült kifejező, irányítható beszéd generáció.

Igen, az OpenVoice azonnali hang klónozást végez néhány másodpercnyi referencia-hangból - nincs szükség kiképzésre. Ha egyszer egy hang elfog, az OpenVoice újra tudja használni ezt az identitást bármilyen szövegen és bármilyen hangstíluson keresztül, amit kiválaszt.

OpenVoice egy kétlépcsős architektúrát használ, amely a hangkonverziótól megosztja a beszédalapú szintézist. A hang klónozása után a 9 hangstílus bármelyikét alkalmazhatja - alapértelmezett, barátságos, vidám, izgatott, szomorú, dühös, rémült, ordító vagy suttogó - és ugyanez a klónozott hang máshogy beszél a választott hangszíned alapján anélkül, hogy újra felvetted volna.

OpenVoice támogatja kilenc beszédstílus: alapértelmezett, barátságos, vidám, izgatott, szomorú, dühös, rémült, kiabáló és suttogó. Minden stílus átformálja az érzelmi szülést, miközben megőrzi a klónozott hangszóró identitását, finoman irányítva a sor olvasását.

Az OpenVoice nyílt forráskódú az engedélyezett MIT licenc alatt, így kereskedelmi használatra is ingyenes. Mint minden klónozási modell esetében, győződjön meg róla, hogy megfelelő jogokkal rendelkezik minden olyan hanghoz, amelyet kereskedelmi projektekhez klónoz.

Az OpenVoice körülbelül 10 nyelvet támogat, köztük angol, kínai, japán, koreai és több európai nyelvet. A többnyelvű klónozást is kínálja, így egy hang klónozható egy nyelven, és természetesen beszélhet egy másik nyelven.

OpenVoice mérsékelt generációs sebesség, jellemzően egy mondat 2-4 másodperc alatt egy GPU. Kimeneti minőség nagyon jó, világos hang reprodukció és hangátvitel, amely tartja a hangszóró identitás érintetlen, miközben meggyőzően változó érzelmi szállítás.

OpenVoice jellemzően 6-8GB VRAM-ot igényel a gyártási mérettől és a hangkonverziós terheléstől függően. Kényelmesen fut a közép- és felső-középkategóriás GPU-kon, és TextToSpeechAI-en mindezt a szervereinken kezeljük, így nincs szükség helyi hardverre.

Az OpenVoice egy Ultra-tier motor, ára 50 kredit 1000 karakterenként. Az Ultra-szint tükrözi a fejlett hangvezérlést és a klónozáshoz szükséges extra komputert, valamint a stílusváltáshoz szükséges vezetéket.

OpenVoice egyedülálló a hang és stílus vezérlése: akkor lehet venni egy klónozott hang, és újra kézbesíteni, mint vidám, szomorú, dühös, vagy suttogás. F5-TTS gyorsabb, és az alapértelmezett klónozó motor a természetes, semleges beszéd. Válassza OpenVoice, amikor szükség van érzelmi stílus vezérlés, és F5-TTS, ha azt szeretnénk, hogy a leggyorsabb természetes klón.

Hozzon létre egy klónozott hangot referencia audio feltöltésével, majd adjon meg egy hangstílust az API kérésében. Az API automatikusan alkalmazza a választott érzelmi hangot a klónozott hangra, és MP3, WAV vagy OGG formátumban adja vissza az audiót.

Igen. Regisztráljon ingyenes TextToSpeechAI fiókot, hogy megkapja az indító krediteket, és próbálja meg az OpenVoice klónozást és hangvezérlést, vagy először használja a honlapon megjelenő demót. Helyi beállítás nem létezik - töltsön fel egy referenciacsipeszt, válasszon egy hangot, és generáljon a böngészőben.

Technical Specs

Generation Speed Moderate
Output Quality Very Good
Voice Cloning Supported
Languages 10
GPU VRAM 3-6GB
Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free

Other TTS Engines

OpenVoice

About OpenVoice

Kulcsfontosságú jellemzők

Azonnali klónozás

Tónusos vezérlés

Stílusátvezetés

Keresztirányban

Gyors feldolgozás

Nyílt forrás

Esetek használata

Hogyan kell alkalmazni? OpenVoice

Regisztráljon ingyen vagy próbálja ki a demót

Válassza az OpenVoice-t és töltsön fel egy referenciaklipet

Írja be a szöveget

Válasszon egy hangstílust és generáljon

Az API letöltése vagy használata

OpenVoice API

Gyakran ismételt kérdések

Milyen típusú gyógyszer az OpenVoice TTS?

Az OpenVoice azonnal klónozza a hangokat?

Hogyan fejti ki hatását az OpenVoice?

Milyen hangszín és stílus lehetőséget kínál az OpenVoice?

Az OpenVoice szabad kereskedelmi úton van?

Milyen nyelveket támogat az OpenVoice?

Milyen gyorsan van OpenVoice és mi a minőség?

Mennyi GPU memória kell OpenVoice?

Hány kreditbe kerül az OpenVoice TextToSpeechAI-ért?

OpenVoice vs F5-TTS - melyiket használjam?

Hogyan kell használni OpenVoice a TextToSpeechAI API?

Megpróbálhatom az OpenVoice-t ingyen TextToSpeechAI-en?

Technical Specs

Try OpenVoice Now

Other TTS Engines

Kéreg

Chatterbox

Hangulatos hangok2