Қалқа

Premium

Күй- күйлері мен дыбыс эффекттері бар, өрнекті ДК сөйлеуName

Slow Жылдамдығы
Very Good Сапа
Жоқ Клондау
13 Тілдер

& Бұл туралы Қалқа

-text audio. Bark is a

Басты мүмкіндіктері

Күй- күйі туралы мәлімет

Оның ішінде ірі қара, қой, ешкі, жылқы, түйе, қой, қойдың еті, сүті, сүт өнімдері.

Көңіл күй белгілері

[күлкі], [еңіреп], нақтылау үшін үлкен әріппен, күмәндану үшін... деп жазыңыз.

Көп тілді

13+ тілдерді қолдайды, табиғи акценттермен және дыбыстармен.

Музыка және эффекттер

Музыкалық аспаптарды, музыкалық аспаптардың музыкалық аспаптарын жасау.

Дыбыс тректерінің алдын- ала баптаулары

Көпшілікке белгілі ақын-жазушылардың шығармаларын аударған.

Ашық коды

MIT лицензиясы бойынша толық коммерциялық пайдалану құқығымен.

Пайдалану жағдайлары

Таңба диалогы Анимацияланған мазмұны Аудиокітаптың баяндауы Ойынның дауыс әрекеті Құрастыру жобалары Expressive көмекшілері

Қалқа Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Пайдалануы Қалқа

  1. 1

    Тегін тіркеліп, демоны ашыңыз

    Бастапқы кредиттерді алу үшін тегін TextToSpeechAI тіркелгісін құрыңыз, немесе тіркеусіз демоны қолданып Bark- ты бірден сынап көріңіз. Тегін кредиттер жаңартудан бұрын бірнеше ықшам Bark клиптерін жасауға жеткілікті.

  2. 2

    Қолтаңбаны таңдау

    Дыбыс тізімін ашып, қалаған дыбысыңызға сәйкес келетін дыбыстарды таңдаңыз. Дыбыстар жоғары деңгейлі (1000 таңба үшін 25 кредит) деп белгіленеді және эмоцияға толы, кейіпкер стиліндегі әңгімелеу үшін бапталған.

  3. 3

    Көңіл күй белгілерімен мәтін енгізу

    Скриптіңізді келтіріп, оған көңіл- күй белгілерін енгізіңіз: күлгені үшін [күлкі], үңілгені үшін [үңілу], үңілу үшін [үңілу],... тоқтап тұрғаны үшін [тоқтау], баса айтқаны үшін CAPS. Мысалы: "О, бұл не! [күлкі] Бұл ҰЛЫ ЖАҢАЛЫҚ... Мен оған сенбеймін!"

  4. 4

    Дыбыс файлын құру

    Құру дегенді басып, сөйлеу мәтініңізді сөйлеу сипатына айналдырып, әрбір белгіні сәйкесті дыбысқа айналдырады. Барк трансформатор моделі арқасында, генерациялау жеңіл тетіктерге қарағанда баяу, сондықтан бір сөйлемді құру үшін бірнеше секунд уақыт керек.

  5. 5

    API жүктеп алу не қолдану

    Нәтижесін қарап шығыңыз, содан кейін оны MP3, WAV не OGG түрінде жүктеп алыңыз. Өзіңіздің қолданбаңызда Bark- ты автоматтандыру үшін Bark дыбысымен TextToSpeechAI API- ны шақырыңыз, содан кейін ұқсас маркерлі мәтінмен ықшам аудионы қайтарыңыз.

Қалқа API

TextToSpeechAI REST API-мен бағдарламалық түрде сөйлеуді құру.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "О, уау! [күлкі] Бұл таңқаларлық... Мен бұл дыбыстың қаншалықты өрнекті екенін ҰНАТАМЫН!",
    "voice": "bark-zh_0"
  }'

Жиі қойылатын сұрақтар

Bark - Suno жасаған трансформатор негізіндегі мәтіннен дыбыс шығару моделі. Дәстүрлі TTS жүйелеріндей емес, Bark табиғи эмоция, күлкі, үңілу және басқа да сөзсіз дыбыстарды шығаратын, өрнекті сөйлемдерді шығарады. Тіпті музыка мен дыбыс эффекттерін шығара алады.

Иә, Bark MIT лицензиясы бойынша ашық көзі бар, коммерциялық пайдалануға рұқсат береді. TextToSpeechAI- да, біз 1000 таңба үшін 25 кредит төлейміз, себебі оны жасау үшін GPU ресурстары қажет.

Bark 13-тен астам тілдерді қолдайды, оның ішінде ағылшын, неміс, испан, француз, хинди, итальян, жапон, корей, поляк, португал, орыс, түрік және қытай тілдерін. Әрбір тілдің өз дыбысы мен акценті бар.

Bark- ты авторегрессивті трансформатор архитектурасы бар, сондықтан ол көпшілік ТТЖ- дан баяу. Графикалық процессордың көмегімен бір сөйлемді жазу 5- 15 секундқа созылады. Бірақ, бұл әрекеттің нәтижесі - айтарлықтай өрнекті әрі табиғи шығару.

Bark тек "семантикалық сұраулар" мен дыбыс шығарғыштың алдын- ала орнатылған параметрлері арқылы ғана дыбыстарды клондауға мүмкіндік береді, сондықтан ол үлгіден кез келген дыбысты клондауға мүмкіндік бермейді. Егер толық дыбыс клондау мақсатыңыз болса, оның орнына TextToSpeechAI- да бар F5- TTS, StyleTTS2, OpenVoice немесе Tortoise- ды қолданыңыз.

Bark мәтініңіздегі жол ішіне қойылған маркерлерді оқып, сәйкесті дыбыстарға айналдырады. Күлкі үшін [laughter], үңілу үшін [sighs], тыныс алу үшін [gasps],... күмәндану немесе тоқтату үшін [laughter], баса айту үшін CAPS. Мысалы: "О, уау! [күлкі] Бұл МЫҢҒАЙЫ... Мен оған сенбеймін!"

Барлық сөйлеуден басқа, Bark күлкі, үңілу, тыныс алу, мұрынды тазалау, дауыссыз сөйлеу сияқты сөзсіз дыбыстарды шығара алады, сонымен қатар, қарапайым музыка мен орта эффекттерін шығара алады. Бұл дыбыстар мәтінге ендірілген [laughter], [sighs], [gasps] деген маркерлермен іске қосылады, бұл Bark- ты стандартты TTS- тан гөрі ықшамдау етеді.

Bark- тың дыбыс сапасы өте жоғары, адам сөйлеуіне тең, эмоциялық мазмұны да табиғи. 24 кГц- тың шығысы кәсіби, бірақ таза сөйлеу сапасы StyleTTS2- ден әлдеқайда төмен.

Bark моделінің өлшеміне қарай 8-12 ГБ VRAM қажет. Толық модельге ~12 ГБ керек, ал кішірек нұсқалары 8 ГБ-тан жұмыс істейді. Процессордың есептеуі өте баяу, сондықтан ұсынылмайды.

Иә, Bark MIT лицензиясымен шығарылған, бұл рұқсат етілген коммерциялық пайдалануға рұқсат береді. Барлық өнімдер, қызметтер мен қолданбаларда Bark- ты еркін қолдана аласыз. TextToSpeechAI- да сіз қосымша төлем жасамас бұрын, тіркеу кредиттеріңізді пайдаланып, Bark- ты тегін сынап көре аласыз.

Bark бір сөйлеушінің [күлу] және [еңіреп] сияқты эмоция белгілерімен сөйлеуіне өте жақсы, ал Dia көп сөйлеушінің [S1] / [S2] айналымдары мен сөзсіз нұсқауларымен диалогына арналған. Bark эмоциялық баяндау мен кейіпкердің дауысы үшін, Dia - кері- бері әңгіме үшін. Екеуі де TextToSpeechAI- да бар.

Bark- тың ерекшелігі - эмоция мен сөзсіз дыбыстарды қоса, шынайы сөйлеу жасау қабілеті. Бұл басқа тетігінен баяу, бірақ шығармашылық мазмұн үшін адамға ұқсас нәтиже береді. Тез синтездеу үшін Piper- ді қолданыңыз. Дыбысын клондау үшін F5- TTS не OpenVoice- ді қолданыңыз.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Қалқа Now

Generate your first audio free. No credit card required.

Start Free