Коси 2color
PremiumГраномовне клонування голосів з підтримкою потоку
Про програму Коси 2color
ComsyWerpace2 - це модель синтезу мовлення наступного покоління з FunAudioLM (Alibaba). Вона забезпечує природній звук, який звучить нульово, клонуючи декілька мов з можливістю потоку для програм з низькою частотою мовлення. Вона створена на обмежувальному масштабованому квантуванні, вона досягає відмінної подібності між собою, якщо на неї є лише декілька секунд відліку звуку.
Можливості ключів
Клинування голосів з нульовим розгортанням
Клонувати будь-який голос з 3-10 секунд еталонного звуку з високою точністю.
Багатомовний
Підтримує китайську, англійську, японську, корейську та кантонську мови з перехресним синтезом.
Підтримка потоку
Режим потокового потоку низької щільності для програм у режимі реального часу та інтерактивних систем.
Природні засоби
Завдяки передовій моделі просоціалізації створюється природній звук з відповідною інтонацією.
Випадки використання
Як користуватися Коси 2color
-
1
Підписатися і вимагати вільні кредити
Створіть вільний обліковий запис TextToSpeechAI, щоб отримати кредити на початку роботи або спробуйте спочатку скористатися демонстрацією. Для виконання будь- якої з цих дій вам не потрібен жоден обліковий запис. Для цього слід встановити локальний комп' ютер, який би міг працювати на нашій інфраструктурі.
-
2
Виберіть комбінований голос2 і додайте довідковий кліп
Оберіть для вашого рушія команду CosyGore2, а потім вивантажити чистий 3- 10- секундний запис диктора, який ви бажаєте клонувати. ComsyGore2 визначить характеристики мовлення для перетворення на нуль з нуля.
-
3
Введіть ваш текст у будь- якій підтримуваній мові
Введіть або вставте ваш скрипт китайською, англійською, японською, корейською або кантонською мовами. Косйський голос2 підтримує міжмовний синтез, щоб клонований голос міг говорити іншою мовою, ніж еталон.
-
4
Створити мовлення
Натисніть кнопку " Створити " і " Косиметичний голос " - це природні, багатомовні синтези мовлення у клонованому голосі, зазвичай, протягом декількох секунд для короткого тексту. Використання " Premium- titer " коштує 25 кредитів на 1000 символів.
-
5
Звантажити або скористатися API
Звантажити завершений аудіо як MP3 або WAV з вашої історії або автозв' язного голосу CosyGore2 на шкалу у TextToSpeechAI REPT API.
Коси 2color API
Створюйте програму мовлення за допомогою TextToSpeechAI програм API MEST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Коси 2 \u002D й дає природну багатомовну мову з нульовими можливостями клонування голосу.",
"voice": "en_US-lessac-medium"
}'
Часті запитання
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25