Chatterbox

Premium

Zéró-lövés hang klónozás kifejező beszéd 23 nyelven

Fast Sebesség
Very Good Minőség
Igen. Klónozás
23 Nyelvek

About Chatterbox

A Chatterbox egy erős hang klónozó TTS modell a Resemble AI-tól. A Chatterbox egy olyan hang klónozását végzi, amely csak néhány másodpercnyi referencia-hangból áll, és 23 nyelvet támogat természetes kifejezéssel. A Chatterbox magában foglalja a paralinguista címkéket, amelyek természetes hangokat, mint a nevetés és a köhögés a generált beszédhez adnak hozzá.

Kulcsfontosságú jellemzők

Zéró hang klónozása

Klón bármilyen hang néhány másodperc audio - nincs szükség képzés.

23 Nyelvek

Arabtól kínaiig, a világ legtöbb fő nyelvét lefedve.

Expressz tag- ek

Hozzáadjuk a természetes paralinguista hangokat.

Gyors következtetés

200 ms alatti késés a Turbo változattal valós idejű alkalmazásokhoz.

Esetek használata

Hang klónozás tartalom létrehozása Többnyelvű hangalkalmazások Karakter hang design játékok Személyre szabott hangsegítő

Hogyan kell alkalmazni? Chatterbox

  1. 1

    Regisztráljon vagy nyissa meg a demót

    Hozzon létre egy ingyenes TextToSpeechAI fiókot 200 indító kredit igénylésére, vagy használja a honlapon demo kipróbálni Chatterbox bejelentkezés nélkül.

  2. 2

    Válassza ki a Chatterbox-ot és adjon hozzá egy referenciaklipet

    Válassza ki a Chatterbox motort, majd töltsön fel egy rövid (pár másodperc) hangklipet a klónozni kívánt hangról. Chatterbox zéró-shot klónozza azonnal - nincs szükség képzésre.

  3. 3

    A szöveg megadása opcionális címkékkel

    Írja be vagy illessze be a szöveget, hogy beszéljen bármelyik a 23 támogatott nyelven, és csepp [nevet], [köhög], vagy [kuncog] címkék bárhol, ahol azt szeretné, természetes paralinguisztikus hangokat.

  4. 4

    A beszéd generálása

    Kattintson a generálás és TextToSpeechAI teszi a szöveget a klónozott Chatterbox hang a házigazdák GPU infrastruktúra, kiadások 25 kredit 1000 karakter.

  5. 5

    Az API letöltése vagy használata

    Töltse le a kész audio fájlt, vagy automatizálja generáció keresztül a TextToSpeechAI REST API api.texttospeechai.com segítségével a számla token.

Chatterbox API

A beszéd programszerű generálása a TextToSpeechAI REST API használatával.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "A Chatterbox képes lemásolni a hangodat néhány másodpercnyi hangról és 23 nyelven beszélni.",
    "voice": "en_US-lessac-medium"
  }'

Gyakran ismételt kérdések

A Chatterbox egy zéró-shot hang klónozó szöveg-nyelv modell a Resemble MI-től. Bármely hangot képes lemásolni néhány másodpercnyi referencia hangból, és természetes, kifejező beszédet generál 23 nyelven, mindezt hangonként történő képzés nélkül.

Igen, a Chatterbox teljesen MIT engedéllyel rendelkezik - mind a kód, mind a modellsúlyok - így szabadon használhatja kereskedelmi termékekben. A generált audió egy opcionális neurális vízjelet tartalmaz, amely letiltható, és nincs használati jogdíj.

Ön ad egy rövid referencia klip bármely hang (néhány másodperc elég) és Chatterbox kivonatok, hogy a hang hang timbre és stílusát egy hangszóró beágyazó. Ezután létrehoz vadonatúj beszéd ebben a hangban finomhangolás vagy edzés lépés nélkül, ami az, amit "zéró-shot" jelent.

A Chatterbox speciális inline tageket olvas a szövegedben, hogy természetes nem verbális hangokat is hozzáadjon: [nevet] behelyez nevetést, [köhög] behelyez egy köhögést, és [köhög] behelyez egy lágy kuncogást. Csak helyezzen el egy címkét, ahol szeretné a hangot, például "Ez nevetséges [nevet], de komolyan..."

Írja be a címkét közvetlenül a bemeneti szövegben a helyszínen, ahol a hang kell történni, körülvéve a többi mondat. Chatterbox teszi a paralinguisztikus hang a klónozott hang, keverve azt a környező beszéd, így úgy hangzik, spontán, ahelyett, hogy beszúrta.

A Chatterbox 23 nyelvet támogat, köztük arab, dán, német, görög, angol, spanyol, finn, francia, héber, hindi, olasz, japán, koreai, maláj, holland, norvég, lengyel, portugál, orosz, svéd, szuahéli, török és kínai nyelvet. Egyetlen klónozott hang beszél ezeken a nyelveken.

A Chatterbox gyorsan beszédeket generál a GPU-n, és a Turbo változat eléri a 200 ms alatti késést valós idejű társalgási használatra. A minőség nagyon jó, természetes proszódiával és hűséges hangvisszaadással még rövid referencia klipekből is.

A Chatterboxnak a változattól függően nagyjából 4-8GB VRAM-ra van szüksége, a Turbo modell kényelmesen, 4GB-ben fut. TextToSpeechAI-en nincs szükség helyi GPU - generációra, amely a mi befogadó infrastruktúránkon fut.

Chatterbox egy prémium-tier motor, amely 25 kredit per 1000 karakter. Új számlák kap 200 ingyenes kreditet próbál hang klónozás, és csak költeni kreditek a szöveg, amit valójában generál.

Mindkét támogatja a zéró hang klónozását, de a Chatterbox sokkal több nyelvet (23 vs 2) tartalmaz, és expresszív paralinguista címkéket is tartalmaz. Az F5-TTS egy kicsit természetesebb angol proszódiát is ki tud húzni, ezért a többnyelvű klónozáshoz és expresszív hangokhoz is válasszon Chatterboxot, valamint az F5-TTS-t az angol-csak-hűséghez.

Mindkettő kiváló minőségű hang klónozást kínál. A Chatterbox 23 nyelvet és inline expresszív tageket támogat, míg az OpenVoice hangstílusú vezérléseket (barát, szomorú, dühös és több) ad hozzá, amelyek a Chatterbox-ban hiányoznak. Válasszon Chatterbox széles körű nyelvi lefedettség és OpenVoice, ha kifejezett érzelmi hangstílusra van szüksége.

Igen. Regisztráljon ingyenes TextToSpeechAI fiókért 200 kezdő kreditért, vagy használja a honlapon megjelenő demót a Chatterbox beírása nélkül. Töltsön fel egy rövid referencia klipet, írja be a szöveget, és hozzon létre egy klónozott hangot másodpercek alatt.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Chatterbox Now

Generate your first audio free. No credit card required.

Start Free