Quru

Premium

Emosiya və səs effektləri ilə ekspressiv AI Speech

Slow Sür'ət
Very Good Keyfiyyət
_Yox Köçür
13 Dillər

Bağlan Quru

s of speech that are not heard by humans. Bark is a

Xüsusiyyətlər

Emotikonlar

Bu sözlər gülüş, inilti, əsəbiləşmə və həqiqi hisslərlə səslənir.

Xəyallar

[gülüş], [sighs], emphasis üçün CAPS, və... üçün şübhə üçün istifadə edin.

Çoxdilli

13+ dili təbii aksent və tələffüzlə dəstəkləyir.

Musiqi və Effektlər

Sadə musiqi və ətraf səsləri yarada bilər.

Hökmdar

Bir çox əvvəlcədən hazırlanmış səsləndirici səsləri müxtəlif üslublarla.

Açıq mənbə

MIT lisenziyası ilə tam kommersiya istifadə hüquqları ilə.

İstifadə halları

Karakterlər Animasiya olunmuş Məzmun Audiokitab Oyun səsi Lahiyə İfadə Yardımcıları

Quru Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Necə istifadə edilməlidir Quru

  1. 1

    Pulsuz qeyd olun və demonu açın

    Başlanğıc kreditlərinizi tələb etmək üçün pulsuz TextToSpeechAI hesabını yaradın, ya da Bark-ı dərhal sınamaq üçün qeydiyyatsız demodan istifadə edin. Pulsuz kreditlər yüksəltmədən əvvəl bir neçə ifadəli Bark klipini yaratmaq üçün kifayətdir.

  2. 2

    Bir səs seç

    Sesi kitabxanasını aç və istədiyiniz tona uyğun olan Bark səsləndiricisini əvvəlcədən seç. Bark səsləri premium səviyyədə (1000 xarakter üçün 25 kredit) etiketlənir və emosional, xarakter-stil danışıq üçün tənzimlənir.

  3. 3

    Emotikonlarla mətni daxil et

    Skriptinizi yazın və Bark emosional işarələrini sətir içinə yerləşdirin: gülüş üçün [laughter], inilti üçün [sighs], nəfəs almaq üçün [gasps],... fasilə üçün və vurğulamaq üçün CAPS. Məsələn: "Oh wow! [laughter] Bu inanılmazdır... buna inanmıram!"

  4. 4

    Audionu yarat

    Yarat və Qurd düyməsini basmaqla mətninizi hər bir işarə üçün uyğun səsə çevirərək ifadəli bir danışığa çevirir. Qurma Bark-ın transformator modeli səbəbindən yüngül mühərriklərdən daha yavaşdır, buna görə də hər cümləyə bir neçə saniyə əlavə olunmalıdır.

  5. 5

    API yüklə və ya istifadə et

    Nəticəni əvvəlcədən gör, sonra onu MP3, WAV, ya da OGG olaraq yüklə. Öz tətbiqinizdə Bark-ı avtomatikləşdirmək üçün Bark səsi ilə TextToSpeechAI API-ni çağırın və eyni marker-qabiliyyətli mətni səsi geri almaq üçün istifadə edin.

Quru API

TextToSpeechAI REST API-ni istifadə edərək proqramlaşdırma yolu ilə danışığı yarada bilərsiniz.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Vay! [gülüş] Bu inanılmazdır... Mən bu səsin nə qədər ifadəli olduğunu BİZƏLƏYİRƏM!",
    "voice": "bark-zh_0"
  }'

Tez-tez Sorulan Sual

Bark Suno tərəfindən yaradılmış transformator əsaslı mətn-səs modeldir. Ənənəvi TTS sistemlərindən fərqli olaraq Bark təbii emosiyalar, gülüş, inilti və digər sözsüz səslərlə yüksək ifadəli danışıq yaradır. Hətta musiqi və səs effektləri də yarada bilər.

Bəli, Bark MIT lisenziyası altında açıq mənbəli proqramdır və pulsuz kommersiya istifadəsinə icazə verir. TextToSpeechAI-də, yaradılması üçün lazım olan GPU resurslarının çox olması səbəbindən 1000 xarakter üçün 25 kredit ödəyirik.

Bark 13+ dili dəstəkləyir ki bunlara ingilis, alman, ispan, fransız, hindi, italyan, yapon, koreyalı, polad, portuqal, rus, türk və çin dilləri daxildir. Hər dil təbii səslənmə və aksentlərə malikdir.

Bark, öz-özünə geriyə dönən transformator mimarisinə görə TTS motorlarından daha yavaşdır. GPU-da tipik bir cümlənin yaradılması 5-15 saniyə çəkir. Bu, daha çox ifadəli və təbii bir nəticə verir.

Bark yalnız "semantik çağırışlar" və səsləndirici əvvəlcədən qurğuları vasitəsilə məhdud səs klonlaşdırmasını təklif edir, buna görə də nümunədən istənilən səsi etibarlı şəkildə klonlaya bilməz. Əgər tam səs klonlaşdırması məqsədinizdirsə, bunun əvəzinə TextToSpeechAI-də mövcud olan F5-TTS, StyleTTS2, OpenVoice, və ya Tortoise istifadə edin.

Bark mətninizdə düzənlənmiş sətir işarələrini oxuyur və onları uyğun səslərə çevirir. Gülüş üçün [laughter], nəfəs almaq üçün [sighs], nəfəs almaq üçün [gasps],... tərəddüd və ya dayanmaq üçün [sighs], və vurğulamaq üçün CAPS istifadə edin. Məsələn: "Oh wow! [laughter] Bu AMAZING... I can't believe it!"

Sadə danışıqdan başqa, Bark gülüş, inilti, nəfəs darlığı, boğaz ağrısı və şaqqıltı kimi sözsüz səslər, həmçinin sadə musiqi və ətraf effektləri də yarada bilər. Bunlar [laughter], [sighs] və [gasps] kimi mətndə yerləşən işarələrlə aktivləşdirilir, bu da Bark-ı standart TTS-dən daha ifadəli edir.

Bark insan dilindəki emosional məzmunla rəqabət apara biləcək çox yaxşı keyfiyyətli səsi təbii ifadəliliyi ilə istehsal edir. 24kHz çıxışı professional səslənir, lakin təmiz səs keyfiyyəti StyleTTS2-dən azca aşağıdır.

Bark modelinin ölçüsünə bağlı olaraq 8-12 GB VRAM tələb edir. Tam model ~12 GB tələb edir, daha kiçik variantlar isə 8 GB ilə işləyir. CPU inference çox yavaşdır və tövsiyə edilmir.

Bəli, Bark MIT lisenziyası altındadır, bu da məhdudiyyətsiz kommersiya istifadəsinə icazə verir. Bark-ı məhsullarda, xidmətlərdə və tətbiqlərdə sərbəst istifadə edə bilərsiniz. TextToSpeechAI-də Bark-ı daha çox pul ödəmədən əvvəl qeydiyyat kreditlərinizi istifadə edərək pulsuz sınaya bilərsiniz.

Bark [gülüş] və [sighs] kimi emosiya işarələrinə malik tək-sözlü ifadəli danışıqlarda üstündür, Dia isə [S1]/[S2] dönmə və sözsüz işarələrlə çox-sözlü dialoq üçün yaradılmışdır. Emosional hekayələr və personaj səsləri üçün Bark, geri-geri söhbətlər üçün Dia seçin. Hər ikisi də TextToSpeechAI-də mövcuddur.

Bark, emosional və sözsüz səslərlə həqiqətən ifadəli bir danışıq yaratmaq qabiliyyətinə malikdir. Digər motorlardan daha yavaşdır, lakin yaradıcı məzmun üçün daha çox insana bənzər nəticələr verir. Daha sürətli sintez üçün Piper istifadə edin. Sesi klonlaşdırmaq üçün F5-TTS və ya OpenVoice istifadə edin.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Quru Now

Generate your first audio free. No credit card required.

Start Free