Tortoise TTS

Ultra

Ultra-vysoká kvalita řeč s bezkonkurenční přirozeností

Very Slow Rychlost
Exceptional Kvalita
Ano. Klonování
1 Jazyky

O aplikaci Tortoise TTS

Tortoise TTS je autoregresivní text-to-speech model, který upřednostňuje kvalitu zvuku především. Použitím kombinace autoregresivní transformátory a difuzní modely, Tortoise generuje extrémně přirozený projev, který zachycuje jemné nuance lidského hlasu. Zatímco pomalejší než jiné modely, Tortoise produkuje nejpřirozenější zvuk TTS výstup k dispozici.

Klíčové funkce

Ultra vysoká kvalita

Nejpřirozenější zvuk TTS výstup k dispozici.

Klonování hlasu

Klonové hlasy s mimořádnou věrností a nuancí.

Přírodní prosoda

Zachycuje jemné vzorce řeči a mikrovýrazy.

Přednastavení kvality

Vyberte si z ultra_fast na vysoce kvalitní zpracování.

Emocionální hloubka

Generuje řeč s opravdovou emocionální rezonancí.

Otevřít zdroj

Apache 2.0 licencované s obchodními právy na užívání.

Pouzdra na použití

Premium audioknihy Filmová produkce Dokumentární podání Profesionální hlasovky Archivní projekty High-End Content

Tortoise TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

Jak se používá Tortoise TTS

  1. 1

    Zaregistrujte se nebo zkuste zdarma demo

    Vytvořit zdarma TextToSpeechAI účet získat startovací kredity, nebo použít homepage demo vyzkoušet Tortoise bez přihlášení. Tortoise je Ultra-tier motor (50 kreditů na 1000 znaků), takže volné kredity jsou ideální pro první krátký test.

  2. 2

    Vyberte želvu a volitelně přidejte hlas ke klonování

    Vyberte hlas Tortoise z hlasového prohlížeče. Chcete-li naklonovat konkrétní osobu, nahrát referenční klip (ideálně několik čistých 5-10 sekund) a Tortoise bude reprodukovat tento hlas s vysokou věrností. Jinak vybrat jeden ze zabudovaných Tortoise hlasů.

  3. 3

    Zadejte svůj text

    Zadejte nebo vložte text, který chcete vyprávět. Protože Tortoise je pomalý, začněte krátkou pasáží potvrdit hlas a tón před odesláním plné kapitoly audioknihy nebo dlouhý skript.

  4. 4

    Vyberte si přednastavit kvalitu a generovat

    Vyberte si předvolbu kvality Tortoise: ultra_fast pro rychlé testy, rychle pro dobrou rychlost/kvalitní rovnováhu (doporučená výchozí), standard, nebo high_kvalita pro maximální realismus. Poté klikněte na generovat a být trpělivý - Tortoise může trvat od 30 sekund do několika minut na klip, zejména při vyšších předvolbách.

  5. 5

    Stáhnout nebo použít API

    Když generace dokončí, stáhněte si zvuk jako MP3, WAV, nebo OGG, nebo přineste jej z vaší historie. Chcete-li automatizovat Tortoise pracovních míst, zavolejte TextToSpeechAI API a projít vybrané kvality přednastaveno - nezapomeňte povolit delší timeouty, protože Tortoise vykresluje pomalu.

Tortoise TTS API

Generovat řeč programově pomocí TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Tortoise trvá svůj čas, ale výsledky stojí za čekání.",
    "voice": "tortoise-angie"
  }'

Často kladené otázky

Tortoise TTS je autoregresivní text-to-speech model vytvořený Jamesem Betkerem, který upřednostňuje kvalitu zvuku především. Kombinuje modelování jazyka na bázi transformátoru s difuze dekódováním pro generování řeči s nesrovnatelnou přirozeností, emocionální hloubkou a lidskou prosodou. Je široce považován za jeden z nejrealističtějších open-source TTS motorů k dispozici.

Ano. Tortoise TTS je open-source pod povoleným Apache 2.0 licence, která umožňuje komerční použití, modifikace a přerozdělování. Na TextToSpeechAI, Tortoise sedí v Ultra úrovni 50 kreditů na 1000 znaků, protože jeho těžké výpočetní požadavky a výjimečné kvality výstupu.

Tortoise je pomalý designem: generuje několik kandidátských klipů autoregresivně a pak vylepšuje ten nejlepší s difuzním modelem a CLVP re-ranking krokem. Tento kvalitní první potrubí znamená, že jeden klip může trvat od 30 sekund do několika minut v závislosti na délce textu a přednastavení kvality. Odměna je, že Tortoise produkuje některé z nejpřirozenějších projevů jakéhokoliv TTS motoru.

Tortoise nabízí čtyři předvolby, které obchodují rychlost pro kvalitu: ultra_fast (~10x rychleji, dobré pro testování), rychlé (~4x rychleji, výchozí výrobní), standardní (vyvážené) a vysoké_kvalitní (maximální kvalita, nejpomalejší). Vyšší předvolby vzorek více kandidátů a spustit více difuzních kroků před výběrem nejlepšího výsledku. Na TextToSpeechAI si můžete vybrat přednastavit před generováním.

Ano, Tortoise TTS podporuje klonování hlasu s mimořádnou věrností. Poskytněte několik krátkých referenčních klipů cílového hlasu (v ideálním případě 3-10 vzorků po 5-10 sekundách každý), a Tortoise zachytí reproduktorův timbre, přízvuk, pacing, a jemné mikro-výrazy. Je to jeden z nejpřesnějších nultých-shot klonovací motory, i když klonování přidává k již dlouhé generaci času.

Tortoise byl vyškolen především na anglických řečových souborů, takže angličtina je tam, kde je jeho kvalita nejsilnější. U vícejazyčných projektů, které potřebují podobný realismus, zvážit F5-TTS nebo CosyVoice2 na TextToSpeechAI, které podporují více jazyků, zatímco stále nabízejí hlasové klonování.

Tortoise produkuje výjimečné, často nerozeznatelné-od-lidské audio. Zachycuje dýchání, váhání, intonaci, a skutečnou emocionální rezonanci, že lehčí modely chybí. To je důvod, proč zůstává oblíbený pro prémiové audioknihy, film vyprávění, a high-end voiceover práce, kde realismus je prvořadý.

Tortoise obvykle vyžaduje 12-24GB VRAM v závislosti na kvalitě přednastavení a velikosti šarže, takže high-end GPU jako RTX 3090, 4090, nebo A100 jsou doporučeny pro místní použití. CPU inference je technicky možné, ale velmi pomalé. Na TextToSpeechAI model běží na naší GPU infrastruktury, takže nepotřebujete žádný vlastní hardware.

Tortoise nativně vykresluje vysoce kvalitní 24kHz WAV audio. Přes TextToSpeechAI si můžete vyžádat MP3, WAV, nebo OGG, a my překódujeme s kvalitním rezervačním kódováním, takže si uchováte jemné detaily modelu v jakémkoli formátu, který váš projekt potřebuje.

Tortoise je v Ultra cenové úrovni na 50 kreditů na 1000 znaků, odráží čas GPU jeho kvalita-první potrubí spotřebuje. Nové účty získat zdarma starter kreditů, takže můžete test Tortoise před spáchání. Ultra úroveň také pokrývá StyleTTS2, OpenVoice, Dia, a Zonos.

Oba jsou Ultra-tier motory, ale obchodují jinak. Tortoise TTS dosahuje absolutního vrcholu přirozenosti a emocionální hloubky, ale je zdaleka nejpomalejší motor. StylTTS2 dodává téměř-Tortoise kvality s mnohem rychlejší generace, což je lepší volbou, když potřebujete mnoho klipů nebo rychlejší obrat. Vyberte Tortoise, když kvalita je non-vyjednávat a čas není omezení.

Ano. Zaregistrujte se na TextToSpeechAI získat zdarma startovací kredity, nebo použijte demo na domovské stránce, a vyberte Tortoise hlas generovat klip bez instalace cokoliv. Vzhledem k tomu, že Tortoise je pomalý, začít s krátkou větou a "rychlý" přednastavit vidět kvalitu před spuštěním delších pracovních míst.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try Tortoise TTS Now

Generate your first audio free. No credit card required.

Start Free