OpenVoiceName

Ultra

Дыбысын іріктеп алу және тонды басқаруName

Moderate Жылдамдығы
Very Good Сапа
Иә Клондау
10 Тілдер

& Бұл туралы OpenVoiceName

of the voice and apply it to the speaking style. OpenVoice is a powerful voice clone model that allows you to clone voices from a

Басты мүмкіндіктері

Тізбекті клондау

Аудио файлдың бірнеше секундынан кез келген дауысты клондау.

Тонды басқару

Apply cheerful, sad, angry, excited, or whisper tones.

Стильдерді тасымалдау

Музыкалық стильдер мен стильдер арасындағы айырмашылықты анықтау.

Тіларалық

Клондалған дауыстарды басқа тілдерде қолдану.

Жедел өңдеу

Бұл ретте гендік инженерияның тиімділігін арттыруға баса назар аударылады.

Ашық коды

Коммерциялық лицензиялар.

Пайдалану жағдайлары

Эмоциялық мазмұны Таңба анимациясы Интерактивті ойындарName Аудиокітаптың баяндауы Маркетингтік бейнелерName Виртуалды көмекшілерName

Пайдалануы OpenVoiceName

  1. 1

    Тегін тіркеліңіз немесе демоны сынап көріңіз

    Бастапқы кредиттерді алу үшін тегін TextToSpeechAI тіркелгісін құрыңыз, немесе беттегі демосын қолданып, OpenVoice- ды іске қосқаннан бұрын тыңдаңыз. Жергілікті графикалық процессор немесе орнату қажет емес - бәрі серверлерде орындалады.

  2. 2

    OpenVoice- ті таңдап, сілтемелі клипті жүктеп беру

    OpenVoice тетігін таңдап, бірнеше секундтық таза сілтемелік аудионы жүктеп алып, мақсатты дауысты бірден клондап алыңыз. OpenVoice дыбыс шығарушыны анықтап, оны кез келген мәтін мен дыбыспен қайта қолдана аласыз.

  3. 3

    Мәтінді келтіріңіз

    Клондалған дауыста айтқысы келетін скриптті келтіріңіз не орналастырыңыз. OpenVoice 10- дан астам тілдерді қолдайды, сонымен қатар тілдер арасында да жеткізе алады, сондықтан сілтемелі клиптерден өзге тілде жазуға болады.

  4. 4

    Тоны стилін таңдап, құру

    OpenVoice- дің 9 дыбыс стилінің бірін таңдап - әдетті, достық, қуаныш, қуанышты, қайғылы, ашуланған, қорқынышты, дауыссыз немесе үңгірлеп - содан кейін оны құрыңыз. Сол клондалған дауыс осы эмоциямен сөйлеп шығады.

  5. 5

    API жүктеп алу не қолдану

    Аудио файлды MP3, WAV, OGG түрінде жүктеп алыңыз, немесе TextToSpeechAI API арқылы автоматты түрде жасап алыңыз, әрбір сұрауыңызда клондалған дауыс пен дыбыс стилін беріңіз.

OpenVoiceName API

TextToSpeechAI REST API-мен бағдарламалық түрде сөйлеуді құру.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice кез келген тонмен сөйлей алады: қуанышты, қайғылы, тіпті жымиып.",
    "voice": "en_US-lessac-medium"
  }'

Жиі қойылатын сұрақтар

OpenVoice - бұл мәтіннен сөйлеуге және дауысты клондауға арналған, дауыс қасиеттерін сөйлеу стилінен ерекшелейтін үлгі. Бұл дауысты клондап, әрбір эмоция үшін жаңа сілтеме дыбысын қажет етпей, әртүрлі эмоциялық тондарды қолдана аласыз. Бұл емлесі айқын, бақылауға болатын сөйлеу генераторы.

Иә, OpenVoice бірнеше секунд ішінде ғана сілтемелік дыбыстарды клондап, тікелей сөйлеуді орындайды - үйрету қажеті жоқ. Дауыс қабылданған соң, OpenVoice бұл дыбыстарды кез келген мәтін мен дыбыс стилінде қайта қолдана алады.

OpenVoice екі сатылы құрылым қолданады, ол негізгі сөйлеу синтезін дыбыс түрлендіруден бөлек жасайды. Дыбысты клондаған соң, 9 дыбыс стилінің бірін қолдана аласыз: әдетті, достық, қуаныш, қуанышты, қайғылы, ашуланған, қорқынышты, дауыссыз, немесе үңгірлескен. Осы клондалған дыбыс қайта жазусыз таңдаған дыбыс стиліне сәйкес келетін дыбыс шығарады.

OpenVoice тоғыз сөйлеу стилін қолдайды: әдетті, достық, қуаныш, қуанышты, қайғылы, ашуланған, қорқынышты, дауыспен және үңгірлеп. Әрбір стилі сөйлеушінің клонын сақтап, сөйлеу жолын қалай оқылатынын егжей- тегжейлі бақылауға мүмкіндік береді.

OpenVoice - MIT лицензиясымен ашық көзі бар бағдарлама, сондықтан коммерциялық мақсатта қолдануға тегін. Барлық клондау үлгілері сияқты, коммерциялық мақсатта клондаған дауысыңызға тиісті құқықтарыңыз бар екенін тексеріңіз.

OpenVoice ағылшын, қытай, жапон, корей және бірнеше еуропалық тілдерді қоса алғанда 10- дан астам тілдерді қолдайды. Сонымен қатар, тілдер арасындағы клондауды ұсынады, яғни бір тілдегі дауысты клондап, оны басқа тілде табиғи түрде сөйлетуге болады.

OpenVoice орташа жылдамдықпен шығарады, әдетте GPU- да сөйлемді 2- 4 секундта шығарады. Шығыс сапасы өте жақсы, дыбысты анық қайталау, дыбыстарды интонациямен беру, сөйлеушінің басын сақтап, эмоцияларды өзгерту.

OpenVoice әдетте, пакет көлеміне және дыбыстарды аудару жүктемесіне қарай 6- 8 ГБ VRAM жад қажет етеді. OpenVoice орташа және жоғары орташа GPU- ларда жақсы жұмыс істейді, ал TextToSpeechAI- да бұл серверлерінде орындалады, сондықтан жергілікті жабдық қажет емес.

OpenVoice - бұл Ultra- деңгейлі тетігі, 1000 таңба үшін 50 кредит төленеді. Ultra деңгейі оның одан әрі тонды басқаруын және клондау мен стиль- аудару конвейеріне қажет қосымша есептеуін көрсетеді.

OpenVoice- дің ерекшелігі - оның дыбыс пен стильді басқаруы: бір ғана клондалған дауысты алып, оны қуанышты, қайғылы, ашуланған, немесе үңгірлеген күйінде қайта шығара аласыз. F5- TTS жылдам әрі табиғи, бейтарап сөйлеу үшін әдетті клондау тетігі. Ең эмоцияға толы стилді басқару үшін OpenVoice- ді, ең жылдам табиғи клондауды қаласаңыз F5- TTS- ті таңдаңыз.

Аудио файлды жүктеп, содан кейін API сұрауында дыбыс стилін келтіріп, клондалған дауысты құрыңыз. API таңдаған эмоциялық дыбыс стилін клондалған дауысқа автоматты түрде қолданып, MP3, WAV не OGG пішімінде аудионы қайтарады.

Иә. OpenVoice- ты клондау мен дыбыстарды басқару үшін тегін TextToSpeechAI тіркелгісіне тіркеліңіз, немесе алдымен беттегі демосын қолданыңыз. Жергілікті баптау жоқ - сілтемелі клипті жүктеп алып, дыбысты таңдап, браузерде жасап алыңыз.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try OpenVoiceName Now

Generate your first audio free. No credit card required.

Start Free