Ծաղիկ

Premium

Էքսպրեսիվ AI ձայնագրություն՝ զգացմունքներով և ձայնային էֆեկտներով

Slow արագություն
Very Good Գործողություն
Ոչ Կլոնավորում
13 Լեզուներ

Ընդհանուր Ծաղիկ

-text audio. It is a

Կարգավորումներ

Էմոցիոնալ արտահայտություն

Generate speech with laughter, sighs, gasps, and genuine emotions.

Էմոցիոնալ նշաններ

Օգտագործեք [ծիծաղ], [հառաչանք], մեծ տառեր շեշտադրման համար, և... դժվարության համար։

Բազմալեզու

13+ լեզվի աջակցություն՝ բնական ակցենտներով և արտասանությամբ։

Երաժշտություն և էֆեկտներ

Կարող է սերտացնել պարզ երաժշտություն և շրջակա միջավայրի ձայներ։

Արտասահմանյան

Ավելի քան մեկ նախապատրաստված ձայներ տարբեր ոճերով։

Առանց կոդ

MIT-ի լիազորագրով՝ ամբողջական առևտրային օգտագործման իրավունքով։

Օգտագործման դեպքեր

Սիմվոլների երկխոսություն Անիմացիոն պարունակություն Ավտոմատ ձայնագրություն Խաղի ձայնային դեր Ծրագրեր Էքսպրեսիվ օգնական

Ծաղիկ Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

Ինչպես օգտագործել Ծաղիկ

  1. 1

    Գրանցվել անվճար և բացել ցուցադրական տարբերակը

    Կերեք անվճար TextToSpeechAI հաշիվ՝ ստանալով սկզբնական վարկային գումարներ, կամ օգտագործեք առանց գրանցման փորձարկումը՝ փորձելու համար Bark-ը։ Անվճար վարկային գումարները բավական են Bark-ի մի քանի արտահայտիչ կադրեր ստեղծելու համար մինչև վերանորոգումը։

  2. 2

    Ընտրեք ձայն

    Ընտրեք ձայնային գրադարանը և ընտրեք Ձեր ցանկացած ձայնին համապատասխանող ձայնային ձայնագրիչը։ Ձեր ընտրած ձայնագրիչը պիտակավորված է որպես բարձրակարգ (25 միավոր յուրաքանչյուր 1000 կերպար) և հարմարեցված է զգացմունքային, կերպարային պատմության համար։

  3. 3

    Տեղադրել տեքստը էմոցիոնալ նշանների հետ

    Տպեք ձեր սցենարը և ներառեք Bark էմոցիաների նշիչները ՝ [ծիծաղ] ծիծաղելու համար, [ծիծաղ] հառաչելու համար, [գլուխը ցած գցելու] հառաչելու համար,... ընդմիջման համար և CAPS շեշտադրման համար։ Օրինակ՝ « Օ՜հ, սա հրաշալի է! [ծիծաղ] Սա հրաշալի է... ես չեմ կարող հավատալ դրան»։

  4. 4

    Ծննդաբերել ձայնային նյութը

    Կտտացրեք Ծրագրել և Ձեր տեքստը կվերածվի արտահայտիչ խոսքի, յուրաքանչյուր նշանակը կվերածվի համապատասխան ձայնի։ Գործողությունը դանդաղ է, քան հեշտ սարքերը՝ Bark- ի փոխակերպման մոդելի պատճառով, այնպես որ թույլ տվեք մի քանի վայրկյան ավելացնել մի նախադասության համար։

  5. 5

    Բեռնել կամ օգտագործել API

    Նախապատրաստել արդյունքը, ապա ներբեռնել այն MP3, WAV կամ OGG ձևաչափով։ Bark-ը ձեր ծրագրում ավտոմատացնելու համար, կոչեք TextToSpeechAI API-ն Bark ձայնով և նույն marker-ով հարուստ տեքստը, որպեսզի վերադարձնեք արտահայտիչ ձայնը։

Ծաղիկ API

Ծրագրային ապահովման միջոցով խոսակցության ստեղծում TextToSpeechAI REST API-ի միջոցով։

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Օհ, վա՜յ! [ծիծաղ] Սա հրաշալի է... ես սիրում եմ, թե որքան արտահայտիչ է դա հնչում:",
    "voice": "bark-zh_0"
  }'

Հաճախակի տրվող հարցեր

Bark- ը ձայնային մոդել է, որը ստեղծվել է Suno- ի կողմից։ Բացի ավանդական TTS համակարգերից, Bark- ը ձայնային մոդել է, որը ձայնային ազդանշաններ է արտահայտում բնական զգացմունքներով, ծիծաղով, ժպտումով և այլ ոչ խոսքային ձայներով։ Այն կարող է նույնիսկ ստեղծել երաժշտություն և ձայնային էֆեկտներ։

Այո, Bark-ը MIT-ի թույլտվությամբ բաց կոդով ծրագրակազմ է, որը թույլ է տալիս ազատ առևտրային օգտագործում։ TextToSpeechAI-ի դեպքում մենք վճարում ենք 25 դրամ յուրաքանչյուր 1000 կերպարի համար՝ հաշվի առնելով գեներացիայի համար անհրաժեշտ GPU-ի ռեսուրսները։

Bark-ը աջակցում է 13+ լեզուների, այդ թվում անգլերեն, գերմաներեն, իսպաներեն, ֆրանսերեն, հնդկական, իտալերեն, ճապոներեն, կորեերեն, լեհերեն, պորտուգալերեն, ռուսերեն, թուրքերեն և Չիներեն։ Յուրաքանչյուր լեզու ունի բնական արտասանություն և ակցենտներ։

Bark- ը ավելի դանդաղ է, քան TTS- ի շատ ռեժիմներ, քանի որ այն ունի ինքնահետադարձ փոխակերպման ճարտարապետություն։ Տիպիկ նախադասությունը GPU- ում սերտիֆիկացնելու համար պահանջվում է 5- 15 վայրկյան։ Դրա փոխարեն այն ավելի արտահայտիչ և բնական է։

Bark-ը առաջարկում է միայն սահմանափակ ձայնի կլոնավորում «սեմատիկ հարցումների» և խոսնակի նախնական կարգավորումների միջոցով, այնպես որ այն չի կարող վստահելի կերպով կլոնավորել ցանկացած ձայնը նմուշից։ Եթե ամբողջական ձայնի կլոնավորումն է ձեր նպատակը, օգտագործեք F5-TTS, StyleTTS2, OpenVoice կամ Tortoise, որոնք բոլորն էլ հասանելի են TextToSpeechAI-ում։

Bark- ը կարդում է ձեր տեքստում տեղադրված ինտերնետային նշանները և վերածում դրանք համապատասխան ձայների։ Կիրառեք [լաց] ծիծաղելու համար, [լաց] ժպտալու համար, [գլուխը ցած] ժպտալու համար,... դժվարանալու կամ ընդմիջման համար, և CAPS շեշտադրման համար։ Օրինակ՝ « Օ՜հ, վա՜յ! [լաց] Սա հրաշալի է... ես չեմ կարող հավատալ դրան»։

Բացի պարզ խոսելուց, Bark- ը կարող է ձայնագրել նաև ծիծաղ, ժպտում, թոթափում, թոքի ջերմություն, ժպտում, ինչպես նաև պարզ երաժշտություն և շրջակա միջավայրի էֆեկտներ։ Այս ձայնագրությունները կարող են ակտիվացնել տեքստում ներառված [ծիծաղ], [ժպտում] և [թոթափում] նշանները, ինչը Bark- ին ավելի արտահայտիչ է դարձնում, քան ստանդարտ TTS- ը։

Bark- ը ձայնի շատ լավ որակ է ապահովում բնական արտահայտչականությամբ, որը հավասարազոր է մարդու խոսքին զգացմունքային բովանդակության համար։ 24kHz արտահոսքը պրոֆեսիոնալ է, չնայած որ պարզ խոսքի որակը StyleTTS2- ից մի քիչ ցածր է։

Bark-ը պահանջում է 8-12 ԳԲ VRAM` կախված մոդելի չափից։ Ամբողջական մոդելը պահանջում է ~12 ԳԲ, իսկ փոքր տարբերակները աշխատում են 8 ԳԲ-ով։ CPU-ի եզրակացությունը շատ դանդաղ է և չի խորհուրդ տրվում։

Այո, Bark-ը MIT-ի լիցենզիայով է, որը թույլ է տալիս անխափան առևտրային օգտագործում առանց լիցենզիաների վճարման։ Դուք կարող եք օգտագործել Bark-ը ձեր ապրանքների, ծառայությունների և ծրագրերի մեջ ազատորեն։ TextToSpeechAI-ի վրա դուք կարող եք փորձել Bark-ը անվճար՝ օգտագործելով ձեր գրանցման վարկային քարտը, մինչև վճարեք ավելին։

Bark-ը լավագույնն է մեկ խոսողի արտահայտիչ խոսքում, որն ունի [ծիծաղ] և [հառաչանք] զգացմունքային նշաններ, իսկ Dia-ն ստեղծված է բազմահոսողի երկխոսության համար [S1]/[S2] շրջադարձերով և անխոս ազդանշաններով։ Ընտրեք Bark-ը զգացմունքային պատմության և հերոսների ձայնի համար, իսկ Dia-ն` առաջ-հետ խոսակցության համար։ Դրանք երկուսն էլ հասանելի են TextToSpeechAI-ում։

Bark- ը յուրահատուկ է իր ունակությամբ ստեղծել իրական արտահայտիչ խոսք՝ զգացմունքներով և ոչ խոսքային ձայներով։ Այն ավելի դանդաղ է, քան այլ գործիքները, բայց ստեղծագործական բովանդակության համար ավելի մարդկային արդյունքներ է տալիս։ Ավելի արագ սինթեզի համար օգտագործեք Piper- ը։ Ձայնի կլոնավորման համար օգտագործեք F5- TTS կամ OpenVoice- ն։

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try Ծաղիկ Now

Generate your first audio free. No credit card required.

Start Free