კოკოროworld. kgm

Standard

სწრაფი, მსუბუქი და ბუნებრივი ხარისხის TTS

Very Fast სიჩქარე
Good ხარისხი
ნვ, ნვ. კლონირება
9 ენაName

ინფორმაცია კოკოროworld. kgm

[Translation temporarily unavailable. Please try again.]

ძირითადი ფუნქციები

ულტრა მსუბუქი

82M პარამეტრები, ~300MB მოდელის ზომა. მიმდინარეობს CPU- ზე მინიმალური რესურსებით.

რეალურ დროშიName

საუბრის გაჩენა, რომელიც უფრო სწრაფია ვიდრე აღდგენის სიჩქარე, GPU აჩქარების გარეშეც კი.

მრავალენოვანიName

მხარდაჭერა ინგლისური, ფრანგული, ესპანური, ჰინდური, იაპონური, ჩინური, იტალიური, პორტუგალიური და კორეული.

ხმის შერწყმა

2002 წელს ორივე გუნდი გაერთიანდა და შექმნეს ეროვნული ლიგა.

გამოყენების შემთხვევები

რეალურ დროში ჩატი და ვირტუალური ასისტენტებიName ტექსტის საუბრად გადამუშავება Edge- ის განთავსება და მობილური პროგრამებიName დიდი მოცულობის ბატის დამუშავება

როგორ გამოიყენოთ კოკოროworld. kgm

  1. 1

    რეგისტრაცია უფასოდ ან დემო ვერსია

    TextToSpeechAI-ის უფასო ანგარიშის შექმნა, რომ 200 კრედიტი მიიღოთ ან გამოიყენოთ დემო, რომ კოკოროს დაუყოვნებლივ მოისმინოთ. სტანდარტული დონე ნიშნავს, რომ კოკორო მხოლოდ 10 კრედიტს 1000 სიმბოლოზე ღირს.

  2. 2

    აირჩიეთ კოკორო ხმა

    გახსნათ ხმის ბრაუზერი და აირჩიეთ კოკორო ხმა თქვენს მიზნობრივ ენაზე (9 მხარდაჭერილი, ინგლისურიდან იაპონურ და კორეულ ენებზე). შეგიძლიათ ასევე გამოიყენოთ კოკორო ხმათა შერწყმა ორი ხმათა შერწყმისთვის ინდივიდუალურ კომბინაციაში.

  3. 3

    შეყვანეთ თქვენი ტექსტი

    რედაქტორში ტექსტის ჩაწერა ან ჩასმა. კოკორო ადვილად უმკლავდება გრძელ ფრაზებს, 82M- პარამეტრის წყალობით, რომელიც რეალურ დროში მუშაობს.

  4. 4

    სიჩქარის დარეგულირება და გენერირება

    დააწესეთ თქვენი გამოყენების შემთხვევის შესაბამისად აღდგენის სიჩქარე და შემდეგ დააჭირეთ "შექმნა". კოკორო აუდიოს რეალურ დროში გადმოცემას უფრო სწრაფად ახდენს, ამიტომ თქვენი საუბარი თითქმის მყისიერად მზად არის.

  5. 5

    API ჩამოტვირთვა ან გამოყენება

    Download the finished audio as MP3 or WAV, or automate generation through the TextToSpeechAI REST API at api.texttospeechai.com for batch and real-time workloads.

კოკოროworld. kgm API

TextToSpeechAI REST API-ს გამოყენებით საუბრის პროგრამულად შექმნა.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ჟვ ჟვაგამ ნა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა ჟვკჲ£ა",
    "voice": "en_US-lessac-medium"
  }'

ხშირად დასმული კითხვებიName

Kokoro არის ულტრა მსუბუქი ტექსტიდან საუბრის მოდელები მხოლოდ 82 მილიონ პარამეტრით. მიუხედავად მისი მცირე ზომის, ის წარმოქმნის ბუნებრივად ჟღერილ საუბარს მრავალ ენაზე რეალურ დროში სიჩქარით, CPU- ს გამოყენების გარეშე.

დიახ, კოკორო სრულად არის Apache 2. 0 ლიცენზირებული - კოდი და მოდელის წონა. ის თავისუფლად შეიძლება გამოყენებულ იქნას კომერციულ პროგრამებში, არანაირი შეზღუდვების გარეშე.

Kokoro მხარს უჭერს ინგლისურს (აშშ და ბრიტანეთი), ფრანგულს, ესპანურს, ჰინდურს, იაპონურს, ჩინურს, იტალიურს, პორტუგალიურს და კორეულს.

Kokoro ერთ- ერთი ყველაზე სწრაფი TTS მოდელია. ის ქმნის საუბარს რეალურ დროში გაშვების სიჩქარესთან შედარებით უფრო სწრაფად, CPU- ს გამოყენების გარეშე, რაც მას იდეალურს ხდის ინტერაქტიული პროგრამებისთვის.

არა, კოკორო არ უჭერს მხარს ხმათა კლონირებას. ის იყენებს დაცულ ხმათა ბიბლიოთეკას ხმათა შერწყმის შესაძლებლობებით. ხმათა კლონირებისთვის გამოიყენეთ F5- TTS, Chatterbox, StyleTTS2, OpenVoice ან Tortoise.

კოკოროს შეუძლია ორი ხმის შერწყმა, რათა შექმნას უნიკალური კომბინაციები. ეს საშუალებას გაძლევთ შექმნათ ინდივიდუალური ხმის თვისებები ტრადიციული ხმის კლონების გარეშე.

ორივე სწრაფი და მსუბუქი მოდელებია. Kokoro- ს უფრო თანამედროვე არქიტექტურა აქვს და მხარს უჭერს ხმის შერწყმას, ხოლო Piper- ს აქვს უფრო დიდი ხმის ბიბლიოთეკა. ორივე შესანიშნავია რეალურ დროში პროგრამებისთვის.

Kokoro- ს შექმნილია CPU- ს მუშაობა და საჭიროებს მინიმალურ რესურსებს - დაახლოებით 300MB. GPU- ს არ სჭირდება, თუმცა GPU აჩქარება მხარდაჭერილია უფრო სწრაფი პროცესისთვის.

დიახ. Kokoro ქმნის საუბარს უფრო სწრაფად ვიდრე აღდგენას, CPU- ს გამოყენების შემთხვევაშიც კი, ძალიან დაბალი დაგვიანებით, ამიტომ ის შესანიშნავია ჩატის ბოტებისთვის, ხმაურიანი ასისტენტებისთვის და პირდაპირი გადაცემებისთვის. მისი 82M- პარამეტრის ზომა ქმნის მეხსიერების გამოყენებას, რაც მას პრაქტიკულს ხდის მაღალი მოცულობის და საზღვრის განთავსებებისთვის.

ხმათა შერწყმა საშუალებას გაძლევთ კოკოროს ორი ხმა ერთმანეთში შეურიოთ, რათა შექმნათ უნიკალური კომბინაცია, რომელიც შეიცავს ინდივიდუალურ თვისებებს. ეს არ არის ტრადიციული ხმათა კლონირება - თქვენ ვერ შეძლებთ სპეციფიური ადამიანის რეპროდუქციას ნიმუშიდან - მაგრამ ეს გაძლევთ უფრო მეტ მრავალფეროვნებას, ვიდრე ფიქსირებული ხმათა ბიბლიოთეკა. შეგიძლიათ ექსპერიმენტები ჩაატაროთ ხმათა შერწყმით პირდაპირ TextToSpeechAI რედაქტორში.

ორივე სწრაფი, CPU- სთვის სასარგებლო სტანდარტული დონის მოდული, ხმათა კლონირებას არ იყენებს. Kokoro ყველაზე მსუბუქია (დაახლოებით 300MB) და მხარს უჭერს ხმათა შერწყმას 9 ენაზე, ხოლო MeloTTS ორიენტირებულია მრავალ ინგლისურ აკენტზე და რეალურ დროში მრავალენოვანი გამონატანის შექმნაზე. აირჩიეთ Kokoro ყველაზე მცირე ზომის და შერწყმისთვის; აირჩიეთ MeloTTS, თუ სპეციფიკური აკენტები გჭირდებათ.

Kokoro არის სტანდარტული დონის მოდული, რომელიც ღირს 10 კრედიტი 1000 სიმბოლოზე - ყველაზე დაბალი დონე TextToSpeechAI. ახალი ანგარიშები იღებენ 200 უფასო კრედიტს, ასე რომ შეგიძლიათ Kokoro- ს უფასოდ სცადოთ. ეს მას ერთ- ერთ ყველაზე ეკონომიურ საშუალებად აქცევს მაღალი ხარისხის საუბრის შესაქმნელად.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try კოკოროworld. kgm Now

Generate your first audio free. No credit card required.

Start Free