ზონები

Ultra

ხმათა გამოხატვის კლონირება ემოციებისა და სტილის კონტროლითName

Medium სიჩქარე
Excellent ხარისხი
ეა კლონირება
5 ენაName

ინფორმაცია ზონები

s. It is a 1.6B parameter text-to-speech model that can be used to clone text from reference audio and can be used to create voices from reference audio. It supports text-to-speech clones from 5-30 seconds of reference audio and can modulate the emotional tone of generated audios to create voices from reference audio and can be used to clone text from reference audio and create voices from

ძირითადი ფუნქციები

ემოციების კონტროლიName

Control speech emotions: happiness, sadness, anger, fear, surprise, disgust, and neutral.

ხმოვანი კლონირებაName

5-30 წრპთლთჲნნარა ჟთლთკარა ჟვ ოპვგყპნა გ ჟთლთკარა ჟ ოპჲმვნვნთწრა ჟყჟ ჟრპანნთრვ ჟთ ოპთგვრჟრგა.

ექსპრესიული საუბარიName

1.6B ოაპამვრპთრვ ოპჲთჱგჲზეარ გთჟჲკჲ თჱპვფვნ დჲგჲპ ჟ ნძანჟთპანა ვმჲუთჲნალნა ოპვეაზა.

მრავალენოვანი

ინგლისური, იაპონური, ჩინური, ფრანგული და გერმანული ენის მხარდაჭერა.

გამოყენების შემთხვევები

ემოციურად გამოხატული შინაარსის შექმნა თამაშის გმირების ხმა ემოციებითName აუდიო წიგნის დიალოგი განწყობითName ინტერაქტიული ხმის გამოცდილებაName

როგორ გამოიყენოთ ზონები

  1. 1

    რეგისტრაცია ან დემო ვერსიის გახსნა

    TextToSpeechAI-იანი წლების დასაწყისში, აშშ-ის მთავრობამ 1988 წელს დაიწყო ელექტრონული ბარათების გამოშვება, რათა დაეხმაროს ხალხს ელექტრონული ანგარიშების დაყენებაში.

  2. 2

    პარამეტრების არჩევა

    აირჩიეთ Zonos ხმა და მოდელის არჩევიდან. ხმათა კლონირებისთვის, ჩატვირთეთ 5-30 წამიანი სუფთა რეფერენციული აუდიო, რათა Zonos- მა ხმამღერი შეადაროს.

  3. 3

    შეყვანეთ თქვენი ტექსტი

    შეყვანა ან შეტანა სკრიპტის, რომლის მოსმენაც გსურთ. Zonos მუშაობს ინგლისურ, იაპონურ, ჩინურ, ფრანგულ და გერმანულ ენებზე.

  4. 4

    თჱბვპთ ვმჲუთწ თ დვნვპთპაი წ.

    თჱბვპთ ვენა ჲრ ჟვმვ ჱჲნჲჟკთ ვმჲუთთ - ნვსრპალნა, ჟპვა, ჟყზალვნთვ, დჲპვღჲჟრ, ჟრპაჳ, ჟვპვნაუთ£ა თლთ ჲეპზანთვ - ოჲჟლვ ჟრთჟნთ დვნვპთპა£ ჱა ეა დჲ ოპვგჲეთქ ჟგჲვრჲ ჟვპთჲჱნჲ ჟგთევŒვ.

  5. 5

    API ჩამოტვირთვა ან გამოყენება

    Play back and download the finished audio, or call the same Zonos engine programmatically through the TextToSpeechAI REST API for automated workflows.

ზონები API

TextToSpeechAI REST API-ს გამოყენებით საუბრის პროგრამულად შექმნა.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ჱჲნჲჟ დჲგჲპთ ჟ ნვგვპჲწრვნ თჱპაჱვნ დჲგჲპ ჟ ჟთლვნ ვმჲუთჲნალვნ კჲნრპჲლ.",
    "voice": "en_US-lessac-medium"
  }'

ხშირად დასმული კითხვებიName

Zones არის Zyphra- ს 1. 6B პარამეტრის ტექსტიდან საუბრის მოდელები. ის სპეციალიზდება გამოხატული საუბრის გენერირებაში ემოციების კონტროლით და ხმათა მაღალხარისხიანი კლონირება. TextToSpeechAI- ზე ის მუშაობს როგორც ულტრა- დონის მოდული ყველაზე ნიუანსური, ემოციურად მდიდარი აუდიოსთვის.

დიახ. Zonos გამოქვეყნებულია Apache 2.0 ლიცენზიით როგორც კოდის, ასევე მოდელის წონისთვის, ასე რომ ის თავისუფლად შეიძლება გამოყენებულ იქნას კომერციულ პროდუქტებში, არაკომერციული შეზღუდვების გარეშე. ეს უსაფრთხო ხდება გადახდილი პროგრამებისთვის, კლიენტის სამუშაოებისთვის და მონეტიზებული შინაარსისთვის.

ზონოსი გამოხატავს ემოციების შვიდ მდგომარეობას - ნეიტრალური, ბედნიერება, ტკივილი, სიბრაზე, შიში, მოულოდნელობა და უხერხულობა - რომელიც თქვენ აირჩევთ წინასწარ. მოდელი არეგულირებს მის გადმოცემას არჩეულ ემოციაზე, ტონის, რიტმის და ინტონაციის გადაადგილებას, ასე რომ ერთი და იგივე ფრაზები შეიძლება ჟღერდეს მხიარულებით ან სიბრაზით. ეს ქმნის ზონოსს იდეალურს იმიტომ, რომ ინდივიდუალური განწყობა და დიალოგები საჭიროა.

ZoneOS მხარს უჭერს 7 ემოციის პარამეტრს: ნეიტრალური, ბედნიერება, ტკივილი, სიბრაზე, შიში, მოულოდნელობა და უხერხულობა. თქვენ შეგიძლიათ აირჩიოთ ერთი ყოველი თაობისთვის, რომ დაარეგულიროთ მთელი კლიპის ემოციური ტონი.

ჱჲნჲჟ ჟვ ჲბლთფგა ჟჲ ჟვკსნეა ჲე 5-30 ჟვკსნეა ჲე ჟგჲ£ჲრ ჟთლთკჲნ, თჱგლვკსგა£თ დჲ ჟგჲ£ჲრ ჟთლთკჲნ თ დჲ ოპვგჲეთ გჲ ნჲგ ჟგთკ. მჲზვქ ეა დჲ კჲმბთნთპაქ ჟჲ ჟვკჲ£ა ჲე ჟვევჟვრრვ ჟვმჲრთთ ჱა ეა დჲ ნაოპაგთქ ჟგთკჲრ ჟპვვნ, ჟპვვნ თლთ ჟრპაჳჲრვნ.

ჱჲნჲჟ ოპჲმვნწ 5 ჟლჲგა: ანდლთფვნ, თჱჲნჟკთ, ფთნჟკთ, ფვპნვჱკთ თ ნვმვფკთ. ჟვმჲრთფნარა კჲნრპჲლა თ დლაჟჲგჲრჲ კლჲნთპანვ ჟვ ოპაგწრ ნა გჟთფკთ რვჱთ ჟლჲგა.

1. 6B პარამეტრების ზომის გამო, Zonos საშუალო სიჩქარით მუშაობს, რის გამოც ნედლი მონაცემების გადაცემა შესანიშნავი, მაღალი გამოსახულების გამოსასვლელი ხდება. ხარისხი საუკეთესოა ემოციური და კლონირებული საუბრისთვის, ამიტომ ის შესაფერისია აუდიოს საბოლოო პროდუქციისთვის, ვიდრე რეალურ დროში მასობრივი წარმოებისთვის.

Zone- ს ს ს სჭირდება 8GB ან მეტი VRAM მისი 1. 6B პარამეტრების მოდელისთვის. გრაფიკული პროცესორი მინიმუმ 10GB- ით რეკომენდებულია კომფორტული მუშაობისთვის, როდესაც ხმის კლონირებას ემოციების კონტროლით აერთიანებთ. TextToSpeechAI- ზე ყველა ეს მუშაობს ჩვენი გრაფიკული პროცესორის უკან, ასე რომ თქვენ არ გჭირდებათ საკუთარი დანადგარები.

Zonos არის ულტრა- დონის მოდული, რომელიც 50 კრედიტს იღებს 1000 სიმბოლოზე. ულტრა დონეზე მისი დიდი მოდელი და განვითარებული ემოციები და კლონინგის შესაძლებლობები აისახება, იგივე დონეზე, როგორც StyleTTS2, Tortoise და OpenVoice.

ორივე გთავაზობთ სტილისა და ემოციის კონტროლს ხმათა კლონირებასთან ერთად. Zonos გთავაზობთ ემოციების 7 განსხვავებულ მდგომარეობას და თანამედროვე 1. 6B არქიტექტურას, ხოლო OpenVoice გთავაზობთ ტონების სტილის, როგორიცაა მეგობრული, მხიარულება და ჩურჩული ძალიან სწრაფი კლონირებასთან ერთად. აირჩიეთ Zonos, თუ გსურთ ემოციების ნათლად არჩევა და მაქსიმალური გამოხატვა; აირჩიეთ OpenVoice, თუ გსურთ ტონების მსუბუქი და სწრაფი გადაადგილება.

Bark-ი ამატებს გამოხატულების მარკერებს, როგორიცაა [სიცილი] და [სიცილი], მაგრამ გთავაზობთ შეზღუდულ კლონირებას, ხოლო Dia-ს ცენტრირდება მრავალმყოფიანი დიალოგზე არავერბალური ხმებით. Zonos-ის ცენტრირდება ემოციების ნათლად გამოხატულ არჩევაზე და ერთხმიანი ძლიერი კლონირება, რაც გაძლევთ თითოეული კლიპის განწყობის ზუსტ კონტროლს. აირჩიეთ მოდული, რომელიც შეესაბამება იმას, თუ გჭირდებათ ემოციების ჭდეები, დიალოგების გადახრები ან შერჩეული ემოციები.

ეა. ნჲგთრვ TextToSpeechAI ოჲჟრჲწნთ ოჲლსფაგარ ბვჱოლარნთ ჟრყოყლნთრვლნთ კპვეთრთ, ა ევმჲრჲ რთ ეაგა ოპჲბლვმთრვ ჟ ჟვპთჲჱნჲჟრრა ეა ჟვ ოპთჟყვმთქ. რჲგა ვ ეჲჟრარყფნჲ, ჱა ეა თჱრვჟრთქ ჱჲნჲჟჲგთრვ ჟვპთჲჱნთ ჟთლთ თ დლაჟჲგჲრჲ კლჲნთპანვ ოპვეთ ეა ჟთ კსოთქ ეჲოყლნთრვლნთ კპვეთრთ.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 8GB+
  • Credits/1000 chars 50

Try ზონები Now

Generate your first audio free. No credit card required.

Start Free