Тортоаз ТТС

Ultra

Говор Ultra-високо качество с неуравновесен естественост

Very Slow Скорост
Exceptional Качество
Да. Клониране
1 Езици

За Тортоаз ТТС

Tortoise TTS е автоматически регресивен текстов модел, който определя качеството на звука над всичко останало. Използвайки комбинация от авторегресивни трансформатори и дифузионни модели, Tortoise генерира изключително естествена реч, която улавя фини нюанси на човешкия глас. Макар че по-бавно от други модели, Tortoise произвежда най-естествения изход на TTS.

Ключови характеристики

Ултра-високо качество

Най-естественото изход ТТС на разположение.

Гласово клониране

Клониране на гласове с изключителна вярност и нюанс.

Естествена прозодия

Улавя фини модели на говор и микро-изражение.

Настройки на качеството

Изберете от ултра_бързо до висококачествено обработване.

Емоционална дълбочина

Създава реч с истински емоционален резонанс.

Отворен източник

Апачи 2.0 лицензирани с търговски права за употреба.

Случаи за използване

Премиум аудиокниги Производство на кино Документарно разказване Професионални ретроспективи Архивалови проекти Съдържание с висок край

Тортоаз ТТС Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

Как да използвате Тортоаз ТТС

  1. 1

    Регистрирайте се или опитайте безплатното демо

    Създайте безплатен TextToSpeechAI акаунт, за да получите стартер кредити, или да използвате домашното демо, за да опитате Tortoise, без да се вписвате в. Tortoise е ултра-тие двигател (50 кредита на 1000 символа), така че безплатните кредити са перфектни за първи къс тест.

  2. 2

    Изберете Tortoise и добавяне на глас към клониране

    Изберете Tortoise глас от гласовия браузър. За да клонирате определен човек, качите референтен клип (идеално няколко чисти 5-10 секунди) и Tortoise ще възпроизведе този глас с висока верност. В противен случай изберете един от вградените Tortoise гласове.

  3. 3

    Въведете вашия текст

    Въведете или вметнете текста, който искате да разкажете. Тъй като Tortoise е бавно, започнете с кратък преход, за да потвърдите гласа и тона преди изпращане на пълна аудиокнига глава или дълги скрипт.

  4. 4

    Изберете качествена настройка и генерирате

    Изберете настройка за качеството на Tortoise: ultra_frash за бързи тестове, бързо за добър скорост/качествеен баланс (препоръчано по подразбиране), стандарт, или висококачество за максимален реализъм. След това кликнете върху генериране и бъдете търпеливи - Tortoise може да отнеме от 30 секунди до няколко минути за клип, особено при по-високи настройки.

  5. 5

    Изтеглете или използвайте API

    Когато поколението завърши, изтегли звука си като MP3, WAV или OGG, или го вземете от историята си. За да автоматизирате Tortoise задачи, се обадете на TextToSpeechAI API и преминете избраното качество преднастройка - не забравяйте, че позволявате по-дълги тайм-аут, тъй като Tortoise извежда бавно.

Тортоаз ТТС API

Генерирайте речна програма с помощта на TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Тортоазата отнема време, но резултатите си струват да чакаме.",
    "voice": "tortoise-angie"
  }'

Често задавани въпроси

Tortoise TTS е авторегресивен текстов модел, създаден от Джеймс Беткър, който приоритизира качеството на звука преди всичко. Комбинира езиков модел на базата на трансформатор с дифузия декодиране, за да генерира говор с несъвпадаща естественост, емоционална дълбочина и човешки прозоди. Той се счита за един от най-реалистичните двигатели на отворен източник TTS на разположение.

Да. Tortoise TTS е открит източник по лиценза на Apache 2.0, който позволява търговска употреба, модификация и преразпределение. На TextToSpeechAI, Tortoise седи в ултра ниво на 50 кредита на 1000 символа, поради неговите тежки изисквания за изчисляване и изключително качество на изхода.

Тортоазът е бавен по дизайна: генерира няколко кандидатски клипове автоматично регресивно и след това усъвършенства най-добрата с дифузионен модел и стъпка за преразпореждане на CLVP. Този първокачествен тръбопровод означава, че един клип може да отнеме от 30 секунди до няколко минути в зависимост от дължината на текста и качеството на настройки. Търговията е, че Tortoise произвежда някои от най-естествените думи на всеки TTS двигател.

Тортоаз предлага четири предпоставки, които търгуват скорост за качеството: ултра_бързо (~10x по-бързо, добро за тестване), бързо (~4x по-бързо, производствено по подразбиране), стандарт (балансирано) и висококачествено (максимално качество, най-бавно). По-високи настройки се вземат повече кандидати и се провеждат повече дифузионни стъпки преди избора на най-добрия резултат. На TextToSpeechAI можете да изберете предпоставка преди генерирането.

Да, Tortoise TTS поддържа клониране на гласа с изключителна верност. Осигурете няколко къси референтни клипове на целевия глас (идеално 3-10 проби от 5-10 секунди всяка), и Tortoise улавя жилетката на говоритела, акцент, пацеиране и фини микро-изрази. Той е един от най-точните нула-изстрелни клониращи двигатели, въпреки че клонирането добавя към вече дългото поколение време.

Тортоаз е обучен предимно по английски език данни, така че английски е мястото, където качеството му е най-силно. За многоязични проекти, които се нуждаят от подобен реализъм, разгледайте F5-TTS или CosyVoice2 на TextToSpeechAI, които подкрепят повече езици, докато все още предлагат гласово клониране.

Тортоазата произвежда изключителен, често неразграничим звук. Тя улавя дишането, колебание, интензитет, и истински емоционален резонанс, който пропуска лесни модели. Ето защо той остава любим за премиум аудиокниги, филмова нарация, и висок глас над работата, където реализмът е от първостепенно значение.

Tortoise обикновено изисква 12-24GB VRAM в зависимост от качеството настройка и размера на партидата, така че висококачествените GPU като RTX 3090, 4090 или A100 се препоръчват за местна употреба. Заключенията на процесора са технически възможни, но изключително бавни. На TextToSpeechAI моделът работи върху нашата GPU инфраструктура, така че не се нуждаете от хардуер от ваша собствена.

Tortoise отразява висококачествено 24kHz WAV аудио. През TextToSpeechAI можете да поискате MP3, WAV, или OGGG, и ние транскодираме с качествено-запазване кодиране, така че да запазите финния детайл на модела в какъвто и да е формат проектът ви се нуждае.

Tortoise е в нивото на ценообразуване на ултра 50 кредита на 1000 символа, което отразява GPU времето първо качество тръбопровод консумира. Нови сметки получават безплатни стартер кредити, така че можете да тест Tortoise преди да се извърши. Ултра ниво също обхваща StyleTTS2, OpenVoice, Dia, и Zonos.

И двете са ултра-тиер двигатели, но те търгуват по-различно. Tortoise TTS достига абсолютния върх на естествеността и емоционалната дълбочина, но е далеч най-бавният двигател. StyleTTS2 осигурява близко-Tortoise качество с много по-бързо поколение, което го прави по-добър избор, когато се нуждаете от много клипове или по-бързо обръщане. Изберете Tortoise, когато качеството е неконтролируемо и времето не е ограничение.

Да. Регистрирайте се на TextToSpeechAI, за да получите безплатни стартер кредити, или да използвате демо на домашната страница, и изберете Tortoise глас, за да генерирате клип, без да инсталирате нищо. Тъй като Tortoise е бавно, започнете с кратко изречение и "бързо" настройка, за да видите качеството, преди да започнете по-дълго работни места.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try Тортоаз ТТС Now

Generate your first audio free. No credit card required.

Start Free