Chatterbox

Premium

Zero-shot-äänikloonaus ja ekspressiivinen puhe 23 kielellä

Fast Nopeus
Very Good Laatu
Kyllä Kloonaus
23 Kielet

Tietoja Chatterbox

Chatterbox on tehokas äänikloonaus TTS-malli Resemble AI:sta. Se suorittaa nollalaukaisuäänen kloonauksen vain muutaman sekunnin mittaisesta referenssiäänestä ja tukee 23 kieltä luonnollisella ilmeellä. Chatterbox sisältää paralingvistisiä tunnisteita, joilla lisätään luonnollisia ääniä, kuten naurua ja yskää aikaansaatuun puheeseen.

Tärkeimmät ominaisuudet

Nollakuuman äänen kloonaus

Kloonaaa minkä tahansa äänen muutamasta sekunnista - koulutusta ei tarvita.

23 kieltä

Arabiasta kiinaksi, joka kattaa useimmat maailman tärkeimmät kielet.

Ilmenevät tunnisteet

Lisää [naurua], [hymyä] luonnollisille paralinguistisille äänille.

Nopea päätelmä

Sub-200ms latenssi Turbo-versiolla reaaliaikaisiin sovelluksiin.

Käytä tapauksia

Äänien kloonaus sisällön luontia varten Monikieliset äänisovellukset Pelien hahmoäänisuunnittelu Henkilökohtaiset ääniavustajat

Miten sitä käytetään Chatterbox

  1. 1

    Rekisteröidy tai avaa demo

    Luo ilmainen TextToSpeechAI-tili, joka vaatii 200 aloituspistettä tai kokeile Chatterboxia sivun demon avulla ilman kirjautumista.

  2. 2

    Valitse Chatterbox ja lisää viitelippis

    Valitse Chatterbox-moottori ja lataa sitten lyhyt (muutaman sekunnin) ääniklipsi äänestä, jonka haluat kloonata. Chatterbox nollakuormittaa sen välittömästi - koulutusta ei tarvita.

  3. 3

    Syötä teksti valinnaisilla tunnisteilla

    Kirjoita tai liitä teksti puhumaan millä tahansa 23:sta tuetusta kielestä, ja pudota [naura], [hymyile] tai [naura] tageja minne tahansa haluat luontaisia paralinguistisia ääniä.

  4. 4

    Luo puhe

    Klikkaa product ja TextToSpeechAI kääntää tekstisi kloonattuun Chatterbox-ääneen GPU-infrastruktuurissa, joka käyttää 25 krediittiä tuhatta merkkiä kohti.

  5. 5

    Lataa tai käytä API-rajapintaa

    Lataa valmis äänitiedosto, tai automatisoi sukupolven kautta TextToSpeechAI REST API at api.texttospeechai.com käyttämällä tilitunnusta.

Chatterbox API

Luo puheohjelmallisesti TextToSpeechAI REST API:n avulla.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Chatterbox voi kloonata äänesi vain muutamasta sekunnista ja puhua 23 kielellä.",
    "voice": "en_US-lessac-medium"
  }'

Usein kysyttyjä kysymyksiä

Chatterbox on Resemblen tekoälystä peräisin oleva nollalaukauksinen äänen kloonaustekstien malli. Se voi kopioida minkä tahansa äänen vain muutaman sekunnin referenssiäänestä ja tuottaa luonnollista, ilmaisumielistä puhetta 23 kielellä, kaikki ilman per-voice-koulutusta.

Kyllä, Chatterbox on täysin MIT-lisensioitu - sekä koodi että mallipainot - joten voit käyttää sitä vapaasti kaupallisissa tuotteissa. Luotuun audioon sisältyy valinnainen hermovesileima, joka voidaan poistaa käytöstä, eikä käyttöpalkkioita ole.

Annat lyhyen referenssipätkän mistä tahansa äänestä (muutama sekunti riittää) ja Chatterbox tyhjentää äänen sävyn ja tyylin kaiuttimeen. Sen jälkeen se synnyttää tuohon ääneen upouuden puheen, jossa ei ole hienosäätöä eikä harjoitusvaihetta, mitä "nollalaukaus" tarkoittaa.

Chatterboxissa lukee tekstiisi erityisiä inline-tunnuksia, joilla lisätään luonnollisia ei-verbaaleja ääniä: [naura] lisää naurua, [hyypiö] lisää yskää ja [kukkula] lisää pehmeän huutelun. Laita vain lappu, johon haluat äänen, esimerkiksi "Se on hupaisaa [naurua] mutta vakavasti...".

Kirjoita tagi suoraan sisääntulotekstiisi paikkaan, jossa äänen pitäisi esiintyä, muun lauseen ympäröimänä. Chatterbox tekee paralinguistisesta äänestä kloonatun äänen ja sekoittaa sen ympäröivään puheeseen, jotta se kuulostaa spontaanilta eikä levitetyltä.

Chatterbox tukee 23 kieltä, kuten arabiaa, tanskaa, saksaa, kreikkaa, englantia, espanjaa, suomea, ranskaa, hepreaa, hindiä, italiaa, japania, koreaa, malaijia, hollantia, norjaa, puolaa, portugalia, venäjää, ruotsia, swahilia, turkkia ja kiinaa. Yksi ainoa kloonattu ääni voi puhua näillä kielillä.

Chatterbox tuottaa puheen nopeasti GPU:lla, ja Turbo-variantti saavuttaa alle 200 ms:n viiveen reaaliaikaiseen keskustelukäyttöön. Laatu on erittäin hyvä, luonnollinen prosody ja uskollinen äänen toisto jopa lyhyistä referenssileikkeistä.

Chatterbox tarvitsee noin 4-8GB VRAM-muistia variantista riippuen, kun Turbo-malli toimii mukavasti noin 4GB:ssä. TextToSpeechAI:n kohdalla ei tarvita paikallisia GPU-sukupolvea isäntäinfrastruktuuriimme.

Chatterbox on huippuluokan moottori, joka maksaa 25 krediitiä tuhatta merkkiä kohti. Uudet tilit saavat 200 krediitiä äänikloonauksen kokeilemiseen, ja käytät hyvityksiä vain tekstiin, jonka todellisuudessa luot.

Molemmat kannattavat nollalaukauksen äänen kloonausta, mutta Chatterbox kattaa paljon enemmän kieliä (23 vs. 2) ja lisää ilmaisukykyisiä paralinguistisia tunnisteita. F5-TTS voi tehdä hieman luonnollisempaa englantilaista prosodiaa, joten valitse Chatterbox monikieliseen kloonaukseen ja ilmaisutaitoisiin ääniin sekä F5-TTS vain englanninkieliseen uskollisuuteen.

Chatterbox tukee 23 kieltä ja inline-ilmaisutunnisteita, kun taas OpenVoice lisää äänensävyn hallintalaitteita (ystävällisiä, surullisia, vihaisia ja muita), joita Chatterboxilta puuttuu. Valitse Chatterbox laajalle kielikattaukselle ja OpenVoice, kun tarvitset selkeää tunneääntä.

Kyllä. Rekisteröidy ilmaiseksi TextToSpeechAI tilille, jotta saat 200 aloituspistettä, tai käytä sivulla olevaa demoa Chatterboxin kuulemiseen ilman kirjautumista sisään. Lataa lyhyt viitelippis, kirjoita tekstisi ja luo kloonattu ääni sekunneissa.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Chatterbox Now

Generate your first audio free. No credit card required.

Start Free