Kalbinė dėžutė

Premium

Nulio-šviesto balso klonavimas su išraiškingu kalba 23 kalbomis

Fast Greitis
Very Good Kokybė
Taip Klonavimas
23 Kalbos

Apie Kalbinė dėžutė

Chatterbox yra galingas balso klonavimo TTS modelis iš Atminties AI. Jis atlieka nulinio šūvio balso klonavimas iš vos kelių sekundžių atskaitos garso, remti 23 kalbos su natūralia išraiška. Chatterbox apima paralingvistinis žymės pridėti natūralių garsų, pavyzdžiui, juokdarys ir kosulys generuoja kalbą.

Pagrindinės savybės

Nulio fotografavimo balso klonavimas

Klonuoti bet balsą iš kelių sekundžių garso - nereikia mokymo.

23 Kalbos

Nuo arabų iki kinų, apimanti dauguma pagrindinių pasaulio kalbų.

Išreikštas žymes

Įdėkite [juoką], [supainioti], [supainioti] natūralių paralingvistinių garsų.

Greitas ištarimas

Sub-200m latentinis su Turbo variantu realiu laiku taikomosios programos.

Naudoti atvejus

Balso klonavimas turinio kūrimui Daugiakalbių balso programų Simbolio balso dizainas žaidimai Personalizuoti balso asistentai

Kaip vartoti Kalbinė dėžutė

  1. 1

    Užregistruoti arba atverti demo

    Sukurti nemokamą TextToSpeechAI paskyrą reikalauti 200 starterio kreditus, arba naudoti on-lapyje demo išbandyti Chatterbox be prisijungimo.

  2. 2

    Pasirinkite pokalbių dėžutę ir pridėti informacinį klipą

    Pasirinkite Chatterbox variklį, tada įkelkite trumpą (keletą sekundžių) garso įrašą apie norimą klonuoti balsą. Chatterbox nul-shot klonai tai iš karto - nereikia mokymo.

  3. 3

    Įveskite savo tekstą su neprivalomomis žymomis

    Įveskite arba įklijuokite tekstą kalbėti bet kuria iš 23 palaikomų kalbų, ir įveskite [juokių], [supainioti] arba [supainioti] žymes, kur norite natūralių paralingvistinių garsų.

  4. 4

    Generuokite kalbą

    Spustelėkite generuoti ir TextToSpeechAI paverčia jūsų tekstą klonuotas Chatterbox balso ant kompiuterizuotos GPU infrastruktūros, išleidžia 25 kreditus 1000 simbolių.

  5. 5

    Atsisiųsti arba naudoti API

    Atsisiųskite baigtą garso failą, arba automate generaciją per TextToSpeechAI REST API ne api.texttospeechai.com naudojant savo paskyros raktą.

Kalbinė dėžutė API

Generuoti kalbos programuoja naudojant TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kalbų dėžutė gali klonuoti jūsų balsą iš vos kelių sekundžių garso ir kalbėti 23 kalbomis.",
    "voice": "en_US-lessac-medium"
  }'

Dažnai užduodami klausimai

Kalbų dėžutė yra nulinės fotografijos balso klonavimo teksto į garsą modelis iš aikštės AI. Ji gali kartoti bet kokį balsą iš vos kelių sekundžių atskaitos garso ir generuoti natūralų, išraiškingą kalbą 23 kalbomis, visi be jokių vienos balso treniruočių.

Taip, Chatterbox yra visiškai MIT licencijuotas - tiek kodas, tiek modelio svoris - todėl galite laisvai naudoti komerciniuose produktuose. Generalizuotas garsas turi neprivalomą nervinį vandens ženklą, kuris gali būti išjungtas, ir nėra naudojimo autorinio atlyginimo.

Pateikite trumpą bet kokio balso fiksacinį klipą (pakaks kelių sekundžių) ir Čatterboxo ištraukas, kad balsas tembre ir stilius į įterpiant garsiakalbį. Tai tada generuoja naują kalbą tame balsu be koreguojančio ar mokymo žingsnis, tai ką reiškia "nulis-shot".

Čatterbox skaito specialias eilines žymas tekste, kad įdėtumėte natūralius neverbalinius garsus: [juokingas] įterpia juoką, [kojelis] įterpia kosulį, o [kokliu] įterpia minkštą čiuptuvą. Tiesiog įdėkite žymą, kur norite garso, pavyzdžiui, "Tai yra linksma, bet rimtai...".

Įveskite žymą tiesiai į įvesties tekstą vietoje, kur turėtų įvykti garsas, apsuptą likusio sakinio. Čatterbox perteikia paralinguistinį garsą klonuotame balse, sumaišydamas jį su aplinkiniu žodžiu, kad jis skamba spontaniškai, o ne suskilęs.

Čatterbox palaiko 23 kalbos, įskaitant arabų, danų, vokiečių, graikų, anglų, ispanų, suomių, prancūzų, hebrajų, Hindi, Italijos, japonų, korėjiečių, Malajų, Olandų, norvegų, lenkų, portugalų, rusų, švedų, suahų, turkų ir kinų. Vienas klonuotas balsas gali kalbėti per šias kalbas.

Chatterbox generuoja kalbą greitai GPU, o Turbo variantas pasiekia sub-200m latentiškumą realiu laiku pokalbių naudojimui. Kokybė yra labai gera, su natūraliu prozodija ir ištikima balso atkūrimo net trumpas nuoroda klipus.

Pokalbiui reikia maždaug 4-8GB VRAM, priklausomai nuo varianto, o turbo modelis veikia patogiai apie 4GB. TextToSpeechAI Jums nereikia vietos GPU - generacijos veikia mūsų valdomoje infrastruktūroje.

Chatterbox yra aukščiausios klasės variklis, kuris kainuoja 25 kreditus 1000 simbolių. Naujos sąskaitos gauna 200 nemokamai kreditus išbandyti balso klonavimo, ir jūs tik išleisti kreditus ant teksto jūs iš tikrųjų generuojate.

Abu palaiko nulinės fotografijos balso klonavimą, tačiau „Chatterbox“ apima daug daugiau kalbų (23 vs 2) ir prideda išraiškingas paralingvistines žymas. F5-TTS gali išsklaidyti šiek tiek natūraliau anglų prozodija, todėl pasirinkite „Chateterbox“ daugiakalbiam klonavimui ir ekspresyviems garsams, ir F5-TTS tik anglų ištikimybei.

Abu siūlomi aukštos kokybės balso klonavimo būdai. Chatterbox palaiko 23 kalbas ir išraiškingas žymes, o OpenVoice papildo tono stiliaus valdiklius (dvejopai, liūdnai, piktai ir daugiau), kurių trūksta Chatterbox. Pasirinkite Chatterbox plačiam kalbos aprėpimui ir OpenVoice, kai jums reikia aiškaus emocinio tono stiliaus.

Taip. Užsiregistruokite nemokamai TextToSpeechAI paskyrai gauti 200 starterio kreditus, arba naudokite demo svetainėje išgirsti Chatterbox be prisijungimo. Įkelkite trumpą orientacinį klipą, įveskite tekstą ir generuokite klonuotą balsą per sekundes.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Kalbinė dėžutė Now

Generate your first audio free. No credit card required.

Start Free