Діа
UltraДіалогове налаштування TTS з клонуванням голосу і невербальними звуками
Про програму Діа
Dia by Nari Labs - це модель аргументу 1. 6B, що зосереджується на текстовому синтезі мовлення. Вона перевершує можливість створення природної розмовної мови з підтримкою невербальних звуків, зокрема сміху, зітхання і кашлю. Dia підтримує створення багатомовних діалогів і клонування голосу з 5- 10 секунд еталонного звуку, що робить її ідеальною для створення реалістичних розмов і голосів символів.
Можливості ключів
Створення діалогового вікна
Створюйте натуральні багатомовні розмови з окремими голосами і повертними.
Звуки без прислів'я
Додайте [сміється] [зітхання], [зітхання], [зітхання] для природного паралінгвістичного вираження.
Клинування голосу
Клонувати будь- який голос з 5- 10 секунд еталонного звуку для персоналізованої мовлення.
Природна розмова
1. 6Б параметри створюють дуже природні розмовні прозодії і інтонацію.
Випадки використання
Як користуватися Діа
-
1
Розписатися безкоштовно або відкрити демонстрацію
Створіть вільний обліковий запис TextToSpeechAI, щоб отримати кредити на початку або відкрийте демонстрацію без підпису, щоб негайно спробувати Діалог.
-
2
Виберіть рушій Dia
На панелі інструментів TTS оберіть пункт Діа зі списку рушіїв. Діа - це орієнтована на дилему, ультра- тайта модель з підтримкою багатомовної програми і правомовної підтримки.
-
3
Записати скрипт діалогу мітками
Завершіть вашу розмову [S1] і [S2], щоб позначити кожну чергу промовця, і закиньте невербальні мітки, такі як [сміх], [зітхання], або (зітхання) де ви хочете мати природні реакції.
-
4
Створити звуковий файл
Натисніть кнопку Створити, щоб надіслати ваш скрипт Dia до нашого вузненого GPU. Dia переводить діалог двомовця з покроковим та вашими невербальними мітками у єдиний звуковий файл.
-
5
Звантажити або викликати API
Звантажити завершений діалог у вибраному вами форматі або автоматично створити його, надішлівши той самий скрипт [S1] / [S2] до API TextToSpeechAI з вашим лекцією на обліковому записі.
Діа API
Створюйте програму мовлення за допомогою TextToSpeechAI програм API MEST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] Привіт, як справи? [S2] Я роблю все чудово, дякую, що запитав!",
"voice": "en_US-lessac-medium"
}'
Часті запитання
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50