Tetkó TTS

Ultra

Ultra-magas minőségű beszéd páratlan természetességgel

Very Slow Sebesség
Exceptional Minőség
Igen. Klónozás
1 Nyelvek

About Tetkó TTS

A tortoise TTS egy automatikus, gerjesztő szöveg-nyelv modell, amely mindenek felett előnyben részesíti az audió minőségét. Autoregresszáló transzformátorok és diffúziós modellek kombinációjával a tortoise rendkívül természetes beszédet generál, amely az emberi hang finom árnyalatait rögzíti. Míg lassabban, mint más modellek, a tortoise a legtermészetesebb TTS kimenetet állítja elő.

Kulcsfontosságú jellemzők

Ultra-magas minőség

A legtermészetesebb hangzású TTS kimenet elérhető.

Hang klónozása

Klónhangok kivételes hűséggel és árnyalatokkal.

Természetes prozody

Elfogja a finom beszéd mintákat és a mikro-kifejezéseket.

Minőségi beállítások

Válasszon az ultra_gyorstól a magas_minőségű feldolgozásig.

Érzelmi mélység

A beszéd valódi érzelmi rezonanciával jön létre.

Nyílt forrás

Apache 2.0 engedéllyel rendelkezik kereskedelmi használati jogokkal.

Esetek használata

Premium hangkönyvek Filmgyártás Dokumentum- naarráció Professzionális hangátvitel Archív projektek Nagy teljesítményű tartalom

Tetkó TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

Hogyan kell alkalmazni? Tetkó TTS

  1. 1

    Regisztráljon vagy próbálja ki az ingyenes demót

    Hozzon létre egy ingyenes TextToSpeechAI számla, hogy kezdő kreditek, vagy használja a honlap demó próbálja Tortoise anélkül, hogy bejelentkezne. Tortoise egy Ultra-tier motor (50 kredit 1000 karakter), így az ingyenes kreditek tökéletesek az első rövid teszt.

  2. 2

    Válassza ki a tortoise és opcionálisan adjunk hozzá egy hangot a klón

    Válasszon egy Tortoise hangot a hangböngészőből. Ha klónozni egy adott személyt, feltölteni egy referencia klipet (ideális esetben néhány tiszta 5-10 másodperces minta) és a Tortoise fogja reprodukálni ezt a hangot a magas hűség. Ellenkező esetben válasszon egy beépített Tortoise hangokat.

  3. 3

    Írja be a szöveget

    Írja be vagy illessze be a szöveget, amit szeretne narrátor. Mivel a tortoise lassú, kezdje egy rövid szakasz, hogy erősítse meg a hangot és a hangot, mielőtt elküld egy teljes hangkönyv fejezet vagy hosszú forgatókönyv.

  4. 4

    Válasszon egy minőségi előre beállított és generál

    Válasszon egy tortoise minőségű előbeállítást: ultra_gyors gyors tesztekhez, gyors a jó sebesség/minőség egyensúlyhoz (ajánlott alapértelmezett), standard vagy magas_minőség a maximális realizmushoz. Ezután kattintson generálni és legyen türelmes - tortoise képes 30 másodperctől több percig klipenként, különösen magasabb preszeteknél.

  5. 5

    Az API letöltése vagy használata

    Amikor a generáció befejezi, töltse le a hang MP3, WAV, vagy OGG, vagy kap ez a történelemből. Automatizálja a tortoise munkahelyek, hívja a TextToSpeechAI API és adja át a választott minőségi előre beállított - ne feledje, hogy hosszabb időkérések, mivel a tortoise teszi lassan.

Tetkó TTS API

A beszéd programszerű generálása a TextToSpeechAI REST API használatával.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "A tortoise\u002Dnak idő kell, de az eredményekre érdemes várni.",
    "voice": "tortoise-angie"
  }'

Gyakran ismételt kérdések

A TTS egy automatikus, a szövegtől a szóig terjedő modell, amelyet James Betker hozott létre, és amely mindenekfelett előnyben részesíti az audiominőséget. A transzformeralapú nyelvmodellezést ötvözi a divergencia dekódolással, hogy a beszéd páratlan természetességgel, érzelmi mélységgel és emberiszerű proszódiával jöjjön létre. Széles körben az egyik legvalószínűbb nyílt forráskódú TTS motornak tekintik.

Igen. A tortoise TTS nyílt forráskódú az engedélyezett Apache 2.0 licenc alatt, amely lehetővé teszi a kereskedelmi felhasználást, a módosítást és az újraelosztást. TextToSpeechAI-en a tortoise az Ultra-szinten ül 50 kredit/1000 karakteren, mivel nehéz komputálási igénye és kivételes kimeneti minősége van.

A tortoise lassú tervezéssel: több jelölt klipet generál automatikusan regresszíven, majd finomítja a legjobbat egy diffúziós modellel és egy CLVP újra rangsoroló lépéssel. Ez a minőség-első csővezeték azt jelenti, hogy egy klip 30 másodpercről több percre is eltarthat a szöveg hosszától és a minőség előbeállításától függően. A tortoise a TTS motor legtermészetesebb beszédét állítja elő.

A tortoise négy előre beállított, a minőség érdekében történő kereskedés sebességét kínálja: ultra_fast (~10x gyorsabb, jó a tesztelésre), gyors (~4x gyorsabb, a gyártás alapértelmezése), standard (kiegyensúlyozott), és magas minőségű (maximális minőség, leglassabb). Magasabb előbeállítások több jelöltet vesznek fel, és több diffúziós lépést futtatnak a legjobb eredmény kiválasztása előtt. TextToSpeechAI-en előkészletet választhatnak generálás előtt.

Igen, a tortoise TTS támogatja a hang klónozását kivételes hűséggel. Adjon meg néhány rövid referencia klipet a cél hangjáról (ideális esetben 3-10 minta 5-10 másodpercenként), és a tortoise elfogja a hangszóró hangjelzését, akcentusát, ritmusát, ritmusát és finom mikrokifejezéseit. Ez az egyik legpontosabb nulla-shot klónozó motor, bár a klónozás növeli a már hosszú generációs időt.

A tortoise elsősorban angol beszédadatkészleteken volt kiképezve, így az angol a legerősebb. A többnyelvű projekteknél, amelyeknek hasonló realizmusra van szükségük, az F5-TTS vagy a CosyVoice2 esetében a TextToSpeechAI-es verziót kell használni, amely több nyelvet támogat, miközben még mindig hang klónozást kínál.

A tortoise kivételes, gyakran megkülönböztethetetlen emberi hangokat eredményez. Lélegzést, habozást, intonációt és valódi érzelmi rezonanciát, ami az öngyújtó modelleknek hiányzik. Ezért marad a prémium hangkönyvek, a filmes narráció és a high-end hangátvitel kedveltje, ahol a realizmus a legfontosabb.

A tortoise általában 12-24GB VRAM-ot igényel a minőségi előre beállított mérettől és a gyártási mennyiségtől függően, ezért olyan csúcsminőségű GPU-k, mint az RTX 3090, 4090 vagy A100 használata ajánlott helyi használatra. A CPU-inferencia technikailag lehetséges, de rendkívül lassú. TextToSpeechAI-en a modell a GPU infrastruktúrán fut, így nincs szükség saját hardverre.

A tortoise natívan kiváló minőségű 24kHz WAV audiót ad. TextToSpeechAI-en keresztül kérheti az MP3, WAV vagy OGG szolgáltatásokat, és mi minőségi-megőrző kódolással kódoljuk, így a modell kiváló részletességét a projekt igényeinek megfelelő formátumban tarthatja meg.

A tortoise az Ultra árszínvonalában van, 1000 karakterenként 50 kredittel, tükrözve a GPU-t, amikor az első csővezetéke fogyaszt. Új számlák ingyenes indító krediteket kapnak, így a tortoise-t az elkötelezettség előtt tesztelheti. Az Ultra szint a StyletTS2, OpenVoice, Dia és Zonos-t is lefedi.

Mindkettő Ultra-tier motor, de ők másképp kereskednek. Tortoise TTS eléri a abszolút csúcsa a természetesség és az érzelmi mélység, de messze a leglassabb motor. StyletTS2 szállít közel-Tortoise minőségű sokkal gyorsabb generáció, így a jobb választás, ha szükség van sok klipek vagy gyorsabb fordulás. Válassza ki a tortoise, ha a minőség nem alku tárgya, és az idő nem egy kényszer.

Igen. Regisztráljon TextToSpeechAI-re, hogy ingyenes kezdő krediteket kapjon, vagy használja a demót a honlapon, és válasszon egy tortoise hangot, hogy klipet hozzon létre anélkül, hogy telepítene bármit. Mivel a tortoise lassú, egy rövid mondattal és a "gyors" előre beállított, hogy a minőséget hosszabb munkák elvégzése előtt.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try Tetkó TTS Now

Generate your first audio free. No credit card required.

Start Free