OpenVoice

Ultra

Instantní hlasové klonování s granulárním ovládáním tónů

Moderate Rychlost
Very Good Kvalita
Ano. Klonování
10 Jazyky

O aplikaci OpenVoice

OpenVoice je univerzální model okamžitého klonování hlasu, který umožňuje jemně zakořeněnou kontrolu nad stylem mluvení. Na rozdíl od jiných klonovacích modelů, OpenVoice odděluje hlasovou identitu od mluvení stylu, umožňuje vám vzít klonovaný hlas a aplikovat různé tóny - veselé, smutné, naštvané, vzrušené nebo šeptající - bez nového referenčního zvuku.

Klíčové funkce

Okamžité klonování

Klonuj jakýkoliv hlas jen z pár sekund zvuku.

Kontrola tónů

Používej veselé, smutné, naštvané, vzrušené nebo šeptající tóny.

Přenos stylu

Oddělit hlasovou identitu od mluveného stylu pro flexibilitu.

Cross- Lingual

Použijte klonované hlasy napříč různými jazyky.

Rychlé zpracování

Efektivní odvoz pro rychlou tvorbu hlasu.

Otevřít zdroj

MIT licencované pro komerční aplikace.

Pouzdra na použití

Emocionální obsah Animace znaků Interaktivní hry Audiobook Narrace Marketingová videa Virtuální asistenti

Jak se používá OpenVoice

  1. 1

    Zaregistrujte se zdarma nebo vyzkoušejte demo

    Vytvořit zdarma TextToSpeechAI účet pro získání starter kreditů, nebo pomocí on-page demo slyšet OpenVoice před odevzdáním. Není zapotřebí lokální GPU nebo instalace - vše běží na našich serverech.

  2. 2

    Vyberte OpenVoice a nahrajte referenční klip

    Vyberte OpenVoice motor a poté nahrajte několik sekund čistého referenčního zvuku, abyste okamžitě naklonovali cílový hlas. OpenVoice zachytí identitu reproduktoru, takže jej můžete znovu použít v libovolném textu a tónu.

  3. 3

    Zadejte svůj text

    Zadejte nebo vložte skript, který chcete mluvit v klonovaném hlase. OpenVoice podporuje kolem 10 jazyků a cross-lingvální doručení, takže můžete psát v jiném jazyce než referenční klip.

  4. 4

    Vyberte tón stylu a generovat

    Vyberte si jeden z devíti stylů OpenVoice - výchozí, přátelský, veselý, vzrušený, smutný, naštvaný, vyděšený, křik nebo šeptání - pak generovat. Stejný klonovaný hlas bude mluvit s tímto emocionální dodání.

  5. 5

    Stáhnout nebo použít API

    Stáhněte si zvuk jako MP3, WAV, nebo OGG, nebo automatizace generace přes TextToSpeechAI API tím, že předává svůj klonovaný hlas a tón stylu v každém požadavku.

OpenVoice API

Generovat řeč programově pomocí TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice může mluvit jakýmkoliv tónem \u002D veselým, smutným, nebo dokonce šeptáním.",
    "voice": "en_US-lessac-medium"
  }'

Často kladené otázky

OpenVoice je pokročilý model text-to-speech a hlas klonování, který jedinečně odděluje hlasovou identitu od mluveného stylu. To vám umožní klonovat hlas a pak použít různé emocionální tóny bez nutnosti nového referenčního zvuku pro každou emoci. Je postaven pro expresivní, ovladatelnou tvorbu řeči.

Ano, OpenVoice provádí okamžité klonování hlasu jen z několika sekund referenčního zvuku - žádný tréninkový běh není nutný. Jakmile je zachycen hlas, OpenVoice může znovu použít tuto identitu přes jakýkoli text a jakýkoli tón stylu, který zvolíte.

OpenVoice používá dvoustupňovou architekturu, která odděluje syntézu řeči od tónu. Po klonování hlasu můžete použít jakýkoli z 9 tónových stylů - výchozí, přátelský, veselý, vzrušený, smutný, vyděšený, vyděšený, křik nebo šeptání - a stejný klonovaný hlas mluví jinak na základě zvoleného tónu bez přehrávání.

OpenVoice podporuje devět řečnických stylů: výchozí, přátelský, veselý, vzrušený, smutný, naštvaný, vyděšený, křik a šeptání. Každý styl přetváří emocionální doručení při zachování klonované reproduktor identity, dává vám jemně zakořeněnou kontrolu nad tím, jak řádek je čtena.

OpenVoice je open-source pod licencí MIT, takže je zdarma pro komerční použití. Stejně jako u jakéhokoliv klonovacího modelu, ujistěte se, že máte právo na jakýkoli hlas, který klonujete pro komerční projekty.

OpenVoice podporuje asi 10 jazyků včetně angličtiny, čínštiny, japonštiny, korejštiny a několika evropských jazyků. Nabízí také mezijazyčné klonování, takže můžete naklonovat hlas v jednom jazyce a mají to mluvit přirozeně v jiném jazyce.

OpenVoice má umírněnou generační rychlost, obvykle vykresluje větu za 2-4 sekundy na GPU. Kvalita výstupu je velmi dobrá, s jasnou reprodukci hlasu a tón přenosu, který udržuje reproduktor identitu neporušenou a přesvědčivě mění emocionální doručení.

OpenVoice obvykle vyžaduje 6-8 GB VRAM v závislosti na velikosti šarže a zatížení přeměnným tónem. Je pohodlně provozován na střední do středního dosahu GPU, a na TextToSpeechAI to vše je řešeno na našich serverech, takže nepotřebujete žádný lokální hardware.

OpenVoice je Ultra-tier motor, cena za 50 kreditů na 1000 znaků. Ultra úroveň odráží jeho pokročilé ovládání tónu a extra výpočet potřebné pro klonování plus styl-konverzní potrubí.

OpenVoice je unikátní pro svůj tón a styl ovládání: můžete vzít jeden klonovaný hlas a znovu-doručit jej jako veselý, smutný, naštvaný, nebo šeptání. F5-TTS je rychlejší a je náš výchozí klonovací motor pro přírodní, neutrální řeč. Vyberte OpenVoice, když potřebujete emocionální styl ovládání, a F5-TTS, když chcete nejrychlejší přírodní klon.

Vytvořte klonovaný hlas nahráváním referenčního zvuku, pak zadejte tónový styl ve vašem API požadavku. API použije váš zvolený emocionální tón na klonovaný hlas automaticky a vrátí zvuk ve formátu MP3, WAV, nebo OGG.

Ano. Zaregistrujte se zdarma TextToSpeechAI účet pro příjem starter kreditů a zkuste OpenVoice klonování a ovládání tónu, nebo použijte on-page demo jako první. Neexistuje žádné lokální nastavení - nahrát referenční klip, vyberte tón, a generovat v prohlížeči.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoice Now

Generate your first audio free. No credit card required.

Start Free