Тортуозные TTS

Ultra

Высококачественная речь с несопоставимой естественностью

Very Slow Скорость
Exceptional Качество
Выполнено Клонирование
1 Знание языков

О том, что Тортуозные TTS

TTS — авторегрессивная модель, которая определяет качество звука, прежде всего. Используя сочетание авторегрессивных трансформаторов и диффузионных моделей, Tortoise производит чрезвычайно естественную речь, которая отражает тонкое нюансирование человеческого голоса. Хотя и медленнее других моделей, Tortoise производит наиболее естественный звуковой выход TTS.

Основные характеристики

Ультравые качества

Самый естественный из имеющихся ТТС.

Голос

Клоновые голоса с исключительной преданностью и нюансами.

Естественный прозодий

Захватывает тонкие речевые рисунки и микровыражения.

Преобразования качества

Выберите от ультра_быстрой до высококачественной обработки.

Эмоциональная глубина

Это порождает речь с подлинным эмоциональным резонансом.

Открытый источник

Апач 2.0 лицензирован с правами коммерческого использования.

Использовать

Премиум Аудиовизуальные книги Производство фильмов Документальная редакция Профессиональные речевые организации Архивные проекты Высокое значение

Тортуозные TTS Voices

View All 18
Tortoise Angie
EN
Tortoise Deniro
EN
Tortoise Freeman
EN
Tortoise Geralt
EN
Tortoise Halle
EN
Tortoise Jlaw
EN
Tortoise Lj
EN
Tortoise Mol
EN
Tortoise Myself
EN
Tortoise Pat
EN
Tortoise Pat2
EN
Tortoise Snakes
EN

Как пользоваться Тортуозные TTS

  1. 1

    Подпиши или попробуй бесплатную демо-демо.

    Создать бесплатный TextToSpeechAI аккаунт для получения стартер-кредитов, или использовать демо-страницу для поиска Tortoise без подписи. Tortoise - это Ultra-System двигатель (50 титров на 1000 знаков), так что бесплатные титры идеальны для первого короткого теста.

  2. 2

    Выбери Тортуаз и факультативно добавь голос к клону

    Выберите тортозный голос из голосового браузера. Чтобы клонировать конкретного человека, загрузите базовый клип (в идеале несколько чистых 5-10 секунд) и Тортоиз воспроизводит этот голос с высокой степенью верности. В противном случае выберите один из встроенных голосов Тортуаза.

  3. 3

    Введите ваш текст

    Напечатайте или вставьте текст, который вы хотите записать. Потому что Tortoise медленно, начните с короткого отрывка, чтобы подтвердить голос и тон перед отправкой полной главы или длинного сценария аудиокниги.

  4. 4

    Выберите предварительно установленный уровень качества и генерируйте его

    Выберите предустановленный клеточный набор: ультра_быстрый для быстрых тестов, быстрый для хорошего скоростного/качественного баланса (рекомендуемый по умолчанию), стандарт или высокое_качество для максимального реализма. Затем нажмите нажим и будьте терпеливы - Tortoise может занять от 30 секунд до нескольких минут на клип, особенно при более высоких предварительных параметрах.

  5. 5

    Загрузка или использование API

    Когда поколение закончит, скачайте звук как MP3, WAV, или ОВГ, или заберите его из своей истории. Чтобы автоматизировать работу Tortoise, позвоните в Tortoise TextToSpeechAI API и пройдите выбранное качество предварительного набора - не забудьте разрешить более длительные временные отрезки, поскольку Tortoise медленно двигается.

Тортуозные TTS API

Создать речь программно используя TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Тортуза занимает время, но результаты стоят того, чтобы ждать.",
    "voice": "tortoise-angie"
  }'

Часто задаваемые вопросы

TTS — авторегрессивная модель, созданная Джеймсом Беткером, которая определяет приоритетность качества звука, прежде всего. Она сочетает трансформаторную модель языка с диффузионным декодированием, чтобы генерировать речь с несопоставимой естественностью, эмоциональной глубиной и прозодиозом человека. Она широко рассматривается как один из самых реалистичных двигателей ТТС с открытым исходным кодом.

Да. TTS является открытым источником в рамках лицензии Apache 2.0, которая допускает коммерческое использование, модификацию и перераспределение. TextToSpeechAI, Tortoise находится в Ultra-ядре по 50 титров на 1000 знаков из-за его тяжелых требований к расчету и исключительного качества выпуска.

Тортуаза медленно конструируется: она производит несколько потенциальных клипов авторегрессивно и затем совершенствует лучший с помощью диффузной модели и ступенчатого реактивного кнопки CLVP. Этот первый кабель качества означает, что один клип может занять от 30 секунд до нескольких минут в зависимости от длины текста и качества предварительно установленного. Компромисс заключается в том, что Tortoise производит некоторые из самых естественных речей любого двигателя TTS.

Tortoise предлагает четыре предварительных набора, которые будут иметь скорость торговли для качества: ультра_быстрая (~10x), быстрая (~4x для тестов), быстрая (~4x для по умолчанию), стандартная (сбалансированная) и высококачественная (максимальное качество, медленнее). Более высокая предварительная выборка больше кандидатов и больше шагов по распространению перед выбором наилучшего результата. TextToSpeechAI вы можете выбрать предварительный набор перед генерацией.

Да, TTS поддерживает клонирование голоса с исключительной точностью. Предоставьте несколько коротких исходных клипов с мишенями (в идеале 3-10 образцов 5-10 секунд каждый), и Tortoise запечатлеет тимбре, акцент, щупание и тонкое микровыражение. Это один из самых точных двигателей клонирования с нулевым каждым выстрелам, хотя клонирование увеличивает и без того долгое поколение.

Для многоязычных проектов, которые нуждаются в аналогичном реализме, рассмотрим F5-TTS или CosyVoice2 на TextToSpeechAI, которые поддерживают больше языков, но все еще предлагают клонирование голоса.

Тортуаз производит исключительный, часто неотличимый звук человека. Он запечатлел дыхание, колебания, интонацию и подлинно эмоциональный резонанс, который упускают более легкие модели. Вот почему он остается любимым для премиальных аудиокниги, кинопродукции и высококлассной работы голосовой огласки, где реализм является главным.

Для Tortoise обычно требуется 12-24GB VRAM в зависимости от качества, предварительно установленного и размера партии, поэтому высококонструктивные GPU, такие как RTX 3090, 4090 или A100, рекомендуются для местного использования. Технико-технологические выводы возможны, но крайне медленные. На TextToSpeechAI модель работает на нашей инфраструктуре GPU, так что вам не нужно какое-либо собственное оборудование.

Tortoise даёт высококачественное аудио 24 кГц WAV. Через TextToSpeechAI вы можете запросить MP3, WAV, или ОВГ, и мы перекодируем с кодированием качества, так что вы храните тонкую деталь модели в любом формате, в котором вам нужен проект.

Tortoise находится в ядре цен на Ультра 50 кредитов на 1000 знаков, что отражает время, которое GPU потребляет его первый качественный трубопровод. Новые счета получают бесплатные стартер-кредиты, так что вы можете проверить Tortoise перед началом. Ultra ярус также охватывает StyleTTS2, OpenVoice, Dia, и Zonos.

И то, и другое - ультрауровневые двигатели, но они по-разному торгуют. ТТТ доходят до абсолютного пика естественности и эмоциональной глубины, но, конечно, являются самым медленным двигателем. Стил ТТШ2 обеспечивает качество почти Tortoise с гораздо более быстрым поколением, что делает его более оптимальным выбором, когда вам нужно много клипов или более быстрый поворот. Выберите Тортуза, когда качество не обсуждается, а время не является ограничением.

Да. Запишитесь на TextToSpeechAI, чтобы получить бесплатные стартер-кредиты, или использовать демо на домашней странице, и выберите тортозный голос, чтобы создать клип, не установив ничего. Потому что Тортуаз медленный, начните с короткого предложения и "быстрый" предваряет качество перед тем, как работать дольше.

Technical Specs

  • Generation Speed Very Slow
  • Output Quality Exceptional
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 12-24GB
  • Credits/1000 chars 50

Try Тортуозные TTS Now

Generate your first audio free. No credit card required.

Start Free