StyleTTS 2
UltraСинтез мовлення з тексту за допомогою перенесення стилів
Про програму StyleTTS 2
StyleTTS 2 досягає синтезу мовлення з людського рівня за допомогою тренувальних і ворожих стилів. За його допомогою можна передавати стилі мовлення з аудіо з використанням дуже природної мови, яка суперечить реальному запису людини. StyleTTS 2 відповідає статусу мистецтва у якості TTS і натурі.
Можливості ключів
Якість людського рівня
Витворює мову, яка відрізняється від людських записів у тестах на сліпому слуханні.
Перенесення стилю
Стиль для перенесення з будь- якого з еталонного звукового зразка.
Природні засоби
Ідеальний ритм, стрес, інтонація з розсіченими моделями.
Клинування голосу
Клонувати голоси з винятковою точністю і натуралічність.
Швидка цінність
Швидше, ніж авторегресивні моделі, але зберігаючи якість.
Відкрити джерело
МТІ узаконили права на повну комерційну діяльність.
Випадки використання
StyleTTS 2 Voices
View All 6StyleTTS2 Default
ENStyleTTS2 Expressive
ENStyleTTS2 Fast
ENStyleTTS2 Natural
ENStyleTTS2 Neutral
ENStyleTTS2 Quality
ENЯк користуватися StyleTTS 2
-
1
Підписування безкоштовно або запуск демо
Створіть вільний обліковий запис TextToSpeechAI для отримання кредитів на початку або скористайтеся демонстрацією домашньої сторінки, щоб почути StyleTTS2 без підписування.
-
2
Виберіть рушій StyleTTS2
Виберіть голос StyleTTS2 з бібліотеки голосів. Щоб клонувати голос, вивантажте 10- 30- другий уривок з кліпу і StyleTTS2 переведе його стиль.
-
3
Введіть ваш текст
Вставте або наберіть скрипт, який ви бажаєте прочитати. StyleTTS2 перевершує значення у англійській і передає природні просоції, стрес та інтонацію у довгих уривках.
-
4
Створити звуковий файл
Натисніть кнопку Створити і TextToSpeechAI переводить ваш звуковий файл StyleTTS2 на GPU. Ultra- tier StyleTTS2 коштує 50 кредитів на 1000 символів.
-
5
Звантажити або скористатися API
Звантажити завершений звук StyleTTS2 як MP3, WAV або OGG або викликати TextToSpeechAI API вашим голосом StyleTTS2 до автозавершеного створення.
StyleTTS 2 API
Створюйте програму мовлення за допомогою TextToSpeechAI програм API MEST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Стилет 2 видає мову настільки природно, що вона суперечить професійним записам людей.",
"voice": "styletts2-default"
}'
Часті запитання
Technical Specs
- Generation Speed Moderate
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 4-6GB
- Credits/1000 chars 50