ჭუჭყიანი

Premium

გამოხატული AI საუბარი ემოციებით და ხმოვანი ეფექტებითName

Slow სიჩქარე
Very Good ხარისხი
ნვ, ნვ. კლონირება
13 ენაName

ინფორმაცია ჭუჭყიანი

-text audio. Bark is a

ძირითადი ფუნქციები

ემოციების გამოხატვაName

დჲგჲპთ ჟჲ ჟმვჳ, გყჱეთქკთ, ჱაეყჳნჲგვნთვ თ თჟრთნჟკთ ვმჲუთთ.

ემოციების მარკერები

თჱოჲლჱგაი დჲლვმთრვ ჱნაფვნთწ ჱა ნაოჲმვნ, თ... ჱა ჟყმნვნთვ.

მრავალენოვანი

13+ ენის მხარდაჭერა ბუნებრივი აკცენტებით და გამოთქმით.

მუსიკა და ეფექტებიName

ჟვ ჟოპაგსგა ჟჲ ოპჲჟრარა მსჱთკა თ ჱგსკჲგთრვ ჲე ჲკჲლთნარა.

ხმოვანი სისტემაName

მრავალი წინასწარ მომზადებული საუბრის ხმა სხვადასხვა სტილის.

ღია კოდიName

MIT ლიცენზია სრული კომერციული გამოყენების უფლებებით.

გამოყენების შემთხვევები

სიმბოლოების დიალოგი ანიმირებული შინაარსი აუდიო წიგნის საუბარიName თამაშის ხმის მოქმედებაName პროექტებიName ექსპრესიული ასისტენტებიName

ჭუჭყიანი Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

როგორ გამოიყენოთ ჭუჭყიანი

  1. 1

    ჟვ ოპთ£აგთ ბვჱოლარნჲ თ ჲრგჲპთ ევმჲრჲ

    შექმნა უფასო TextToSpeechAI ანგარიში, რომ მიიღო კრედიტები ან გამოიყენე დემო ვერსია, რომ დაუყოვნებლივ სცადოთ Bark. უფასო კრედიტები საკმარისია რამდენიმე გამოხატული Bark კლიპის შესაქმნელად, სანამ გაუმჯობესებას დაიწყებთ.

  2. 2

    აირჩიეთ ხმა

    გახსნა ხმის ბიბლიოთეკა და აირჩიეთ ხმამაღალი ხმა, რომელიც შეესაბამება თქვენს ტონს. ხმამაღალი ხმა არის მოწინავე დონის (25 კრედიტი 1000 სიმბოლოზე) და ემოციურ, სიმბოლოს სტილის საუბარზეა მორგებული.

  3. 3

    ტექსტის შეყვანა ემოციების მარკერებით

    შეყვანეთ თქვენი სკრიპტი და ჩასვით ემოციების მარკერები: [სიცილი] სიცილისთვის, [სიცილი] ჟრუანტელისთვის, [გაზიზღება] გაზიზღებისთვის,... პაუზისთვის და CAPS ხაზგასმისთვის. მაგალითად: "ოჰ, ვაუ! [სიცილი] ეს საოცარია... არ შემიძლია ამის დაჯერება!"

  4. 4

    აუდიოს შექმნა

    დაწკაპუნებით "შექმნა" და "მღერვა" თქვენი ტექსტი გამოხატული საუბრის ფორმას მიიღებს, თითოეული მარკერი შესაბამის ხმაში გადაიქცევა. შემუშავება უფრო ნელა მიმდინარეობს, ვიდრე მსუბუქი მოწყობილობები, რადგან Bark- ის ტრანსფორმატორის მოდელი არსებობს, ამიტომ ფრაზას რამდენიმე წამი დასჭირდება.

  5. 5

    API ჩამოტვირთვა ან გამოყენება

    შედეგის წინასწარ ნახვა, შემდეგ მისი ჩამოტვირთვა MP3, WAV ან OGG ფორმატში. ხმაურიანი ხმების ავტომატიზაციისთვის თქვენს პროგრამაში, გამოიძახეთ TextToSpeechAI API ხმაურიანი ხმებით და იგივე მარკერით მდიდარი ტექსტი, რომ მიიღოთ გამოხატული ხმა.

ჭუჭყიანი API

TextToSpeechAI REST API-ს გამოყენებით საუბრის პროგრამულად შექმნა.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ჲგა ვ ნვგვპჲ£არნჲ... ჲბთფამ კჲლკს ვკჟოპვჟთგნჲ ჱგსფთ!",
    "voice": "bark-zh_0"
  }'

ხშირად დასმული კითხვებიName

Bark არის ტექსტის აუდიო ფორმაში გადამუშავების ტრანსფორმატორზე დაფუძნებული მოდელი, რომელიც შეიქმნა Suno- ს მიერ. ტრადიციული TTS სისტემებისგან განსხვავებით, Bark ქმნის მაღალექსპრესიულ საუბარს ბუნებრივი ემოციებით, სიცილით, ჟრუანტელით და სხვა არავერბალური ხმებით. მას შეუძლია მუსიკისა და ხმოვანი ეფექტების შექმნა.

- ეა, ბაპკ ვ ჲრგჲპვნ ჟჲპრ ოჲ ჟთრ ლთჟვნჱა, თ დჲ ჲჱბჲპსგა ჟგჲბჲენჲრჲ კჲმვპუთალნჲ ოჲლჱგანვ. TextToSpeechAI- ჲრ ნვდჲ ჟვ ოჲლჱგა ჱა 25 კპვეთრთ ჱა 1000 ჟთმბჲლთ, ჱაღჲრჲ ჟვ ოჲრპვბნთ ჟმვქნთ დპაპეთანჟკთ პვჟსპჟთ ჱა დვნვპთპანვ.

Bark მხარს უჭერს 13+ ენას, მათ შორის ინგლისურს, გერმანულს, ესპანურს, ფრანგულს, ჰინდურს, იტალიურს, იაპონურს, კორეულს, პოლონურს, პორტუგალიურს, რუსულს, თურქულს და ჩინურს. ყველა ენა აქვს ბუნებრივი გამოთქმები და აქცენტები.

Bark უფრო ნელა მუშაობს, ვიდრე TTS- ის უმეტესობა, რადგან ავტორეგრესული ტრანსფორმატორის არქიტექტურა აქვს. გრაფიკული პროცესორის მიერ ტიპიური ფრაზების შექმნა 5- 15 წამს იღებს. შედეგი უფრო გამოხატული და ბუნებრივი გამონატანია.

Bark მხოლოდ შეზღუდული ხმის კლონირებას სთავაზობს "სემანტიკურ თხოვნათა" და მთარგმნელის წინასწარ განსაზღვრული პარამეტრების საშუალებით, ამიტომ ის ვერ შეძლებს ნამუშევრის ხმაზე მყოფი ხმის სწორად კლონირებას. თუ თქვენი მიზანი სრული ხმის კლონირებაა, გამოიყენეთ F5- TTS, StyleTTS2, OpenVoice ან Tortoise, რომლებიც ყველა ხელმისაწვდომია TextToSpeechAI- ზე.

Bark კითხულობს თქვენს ტექსტში პირდაპირ განთავსებულ შიგნით მარკერებს და ქმნის მათთან თავსებად ხმებს. გამოიყენეთ [smile] სიცილისთვის, [sighs] ტირილისათვის, [gasps] ფილტვების გაღიზიანებისთვის,... დუმილის ან პაუზისთვის და CAPS ხაზგასმისთვის. მაგალითი: "O wow! [smile] ეს საოცარია... არ შემიძლია ამის დაჯერება!"

ჩვეულებრივი საუბრის გარდა, Bark- ს შეუძლია არავერბალური ხმების წარმოქმნა, როგორიცაა სიცილი, ჟრუანტელი, ხმაური, ყლაპვის გაწმენდა და ჭორფლის ჭრილობა, ასევე მარტივი მუსიკა და გარემოს ეფექტები. ეს ხმაები გამოწვეულია ტექსტით ჩასმული მარკერებით, როგორიცაა [სიცილი], [ხმაური] და [ხმაური], რაც Bark- ს უფრო გამოხატულს ხდის, ვიდრე სტანდარტული TTS.

Bark აწარმოებს ძალიან კარგი ხარისხის აუდიოს ბუნებრივი გამოხატვით, რომელიც ადამიანის საუბარს ემულსიურ შინაარსში ებრძვის. 24kHz გამონატანი პროფესიონალურად ჟღერს, თუმცა სუფთა საუბრის ხარისხი StyleTTS2- ს ქვემოთ არის.

Bark-ს სჭირდება 8-12GB VRAM მოდელზე დამოკიდებული. სრული მოდელისთვის საჭიროა ~12GB, ხოლო მცირე ვარიანტებისთვის 8GB. CPU-ს დასკვნა ძალიან ნელა ხდება და არ არის რეკომენდებული.

დიახ, Bark- ს აქვს MIT ლიცენზია, რომელიც საშუალებას გაძლევთ უზრუნველყოთ უზრუნველყოფა უფასოდ. შეგიძლიათ გამოიყენოთ Bark პროდუქტებში, სერვისებში და პროგრამებში თავისუფლად. TextToSpeechAI- ზე შეგიძლიათ Bark- ის უფასო გამოცდა, თქვენი რეგისტრაციის კრედიტების გამოყენებით, სანამ უფრო მეტს გადაიხდით.

Bark-ი ერთ-ერთი საუკეთესოა ერთ-ერთი მსაუბრის გამოხატული საუბრისთვის, ისეთი ემოციების მარკერებით, როგორიცაა [სიცილი] და [ყვირილი], ხოლო Dia-ს შექმნილია მრავალ-მსაუბრის დიალოგისთვის [S1]/[S2] გადახრებით და არავერბალური ნიშნებით. აირჩიეთ Bark ემოციური თხრობასა და გმირის ხმაზე, და Dia შუალედური საუბრებისთვის. ორივე ხელმისაწვდომია TextToSpeechAI-ზე.

Bark- ის უნიკალური თვისებაა ის, რომ ის ემოციებითა და არავერბალური ხმებით ნამდვილად გამოხატული საუბრის შექმნას შეძლებს. ის სხვა მოდულებთან შედარებით უფრო ნელა მუშაობს, მაგრამ კრეატიული შინაარსისთვის უფრო ადამიანური შედეგები გამოიმუშავებს. სწრაფი სინთეზისთვის გამოიყენეთ Piper. ხმათა კლონირებისთვის გამოიყენეთ F5- TTS ან OpenVoice.

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try ჭუჭყიანი Now

Generate your first audio free. No credit card required.

Start Free