ხმა2Name

Premium

Zero-shot მრავალენოვანი ხმათა კლონირება სტრიმინგის მხარდაჭერით

Fast სიჩქარე
Very Good ხარისხი
ეა კლონირება
5 ენაName

ინფორმაცია ხმა2Name

[Translation temporarily unavailable. Please try again.]

ძირითადი ფუნქციები

ხმათა კლონირება

ჟვკჲ£ დლაჟ ჟჲ 3-10 ჟვკსნეთ ჲე ჟგჲ£ჲრ ჲეჟრჲ£ ჟჲ ჟთლნა ოპვჱვნრაუთ£ა.

მრავალენოვანი

მხარს უჭერს ჩინურ, ინგლისურ, იაპონურ, კორეულ და კანტონის ენებს ენათაშორის სინთეზთან ერთად.

სტრიმინგის მხარდაჭერა

მცირე დროის ლოდინის რეჟიმი რეალურ დროში პროგრამებისა და ინტერაქტიული სისტემებისთვის.

ბუნებრივი პროზოდი

1990 წელს ჟურნალი „The Economist“-მა ნობელის პრემია მიენიჭა ჟურნალისტიკის დარგში.

გამოყენების შემთხვევები

მრავალენოვანი შინაარსის შექმნაName რეალურ დროში ხმის ასისტენტებიName ენაName ინდივიდუალური ხმოვანი პროგრამებიName

როგორ გამოიყენოთ ხმა2Name

  1. 1

    რეგისტრაცია და უფასო კრედიტების მოთხოვნა

    შექმნა უფასო TextToSpeechAI ანგარიში, რომ მიიღო კრედიტები ან სცადე დემო. არ არის საჭირო GPU ან CosyVoice2- ის ლოკალური დაყენება - ყველაფერი მუშაობს ჩვენს ინფრასტრუქტურაზე.

  2. 2

    აირჩიეთ CosyVoice2 და დამატება რეფერენციული კლიპის

    აირჩიეთ CosyVoice2 როგორც თქვენი მოდული, შემდეგ ჩატვირთეთ 3-10 წამიანი რეფერენტული ჩანაწერი იმ ხმის შესახებ, რომლის კლონირებაც გსურთ. CosyVoice2 ამოიღებს მთარგმნელს თვისებებს ნულოვანი შოტის მრავალენოვანი კლონირებისთვის.

  3. 3

    შეყვანეთ ტექსტი ნებისმიერ მხარდაჭერილ ენაზე

    ჩაწერეთ ან ჩასვით თქვენი სკრიპტი ჩინურ, ინგლისურ, იაპონურ, კორეულ ან კანტონის ენაზე. CosyVoice2 მხარს უჭერს ენათაშორის სინთეზს, ასე რომ კლონირებული ხმა შეიძლება ილაპარაკოს სხვა ენაზე, ვიდრე რეფერენტული ვიდეო.

  4. 4

    საუბრის შექმნა

    დააწკაპუნეთ შექმნა და CosyVoice2-მ ინდივიდუალური, მრავალენოვანი საუბარი კლონირებული ხმაში შესინტეზებს, ჩვეულებრივ რამდენიმე წამში მოკლე ტექსტისთვის. Premium-ის დონის გამოყენება ღირს 25 კრედიტი 1000 სიმბოლოზე.

  5. 5

    API ჩამოტვირთვა ან გამოყენება

    MP3 ან WAV ფორმატში აუდიოს ჩამოტვირთვა ისტორიიდან, ან CosyVoice2-ის ხმის კლონირება ავტომატურად TextToSpeechAI REST API-ის საშუალებით.

ხმა2Name API

TextToSpeechAI REST API-ს გამოყენებით საუბრის პროგრამულად შექმნა.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "CosyVoice2\u002Dი გვაწვდის ბუნებრივ მრავალენოვან საუბარს, ნულოვანი\u002Dსროლის ხმათა კლონირებას.",
    "voice": "en_US-lessac-medium"
  }'

ხშირად დასმული კითხვებიName

CosyVoice2 არის FunAudioLLM- ის (Alibaba) მომავალი თაობის ტექსტიდან საუბრისა და ხმათა კლონირებას მოდელები. ის მხარს უჭერს 0- ჯერ ხმათა კლონირებას მხოლოდ რამდენიმე წამიანი ხმოვანი რეფერენციიდან და შეუძლია ჩინური, ინგლისური, იაპონური, კორეული და კანტონის ენის ბუნებრივი საუბრის სინთეზირება. TextToSpeechAI- ზე შეგიძლიათ CosyVoice2- ის გამოყენება ბრაუზერში ლოკალური კონფიგურაციის გარეშე.

დიახ, CosyVoice2 სრულად არის Apache 2. 0 ლიცენზირებული - კოდი და მოდელის წონა. ეს უსაფრთხოებს მის გამოყენებას კომერციულ პროდუქტებში, გადახდილი შინაარსის და კლიენტის მუშაობაში ლიცენზიის გადასახადების ან არაკომერციული შეზღუდვების გარეშე.

CosyVoice2 მხარს უჭერს ხუთი ენას: ჩინური (მანდარინური), ინგლისური, იაპონური, კორეული და კანტონული. იგი ასევე ახორციელებს ენათაშორის სინთეზს, ასე რომ თქვენ შეგიძლიათ ხმა ერთ ენაზე ჩაწერილი ჩანაწერიდან კლონირება და მეორე ენაზე საუბრის შექმნა.

3-10 წამის განმავლობაში მოწოდებულია მიზნობრივი მთარგმნელის სუფთა რეფერენციული აუდიო. CosyVoice2 ამოიღებს მთარგმნელის თვისებებს საზღვრული სკალარული კვანტური მიდგომის გამოყენებით, შემდეგ კი აგენერირებს ახალ საუბარს ამ კლონირებული ხმაში ნებისმიერი მხარდაჭერილი ენის გამოყენებით. მოდელის სწავლება ან სწორად დაყენება არ არის საჭირო.

CosyVoice2 ერთ- ერთი ყველაზე ძლიერი მრავალენოვანი კლონინგის მოდელი, რომელიც დაცავს საუბრის იდენტიფიკაციას, როდესაც საუბარი იქმნება სხვა ენაზე, ვიდრე რეფერენტული ვიდეო. ის ქმნის ბუნებრივ პროზოდიას და ინტონაციას, რაც მას იდეალურს ხდის ენის გადაკვეთასა და ლოკალიზებულ შინაარსზე.

CosyVoice2 არის სწრაფი მოდელები და შეიცავს აუდიოს ნაკლებად ნელი გაშვების რეჟიმს, რომელიც შესაფერისია ხმაურიანი ასისტენტებისა და ინტერაქტიული პროგრამებისთვის. TextToSpeechAI- ზე წარმოება ჩვეულებრივ გრძელი ტექსტის შემთხვევაში წამებში მთავრდება.

CosyVoice2- ს 0. 5B პარამეტრის მოდელისთვის საჭიროა 4- 6GB VRAM, ამიტომ გრაფიკული პროცესორი 6GB ან მეტი რეკომენდებულია თვით- ჰოსტინგისთვის. TextToSpeechAI- ზე მოდელი მუშაობს ჩვენი გრაფიკული პროცესორის ინფრასტრუქტურაზე, ასე რომ თქვენ არ გჭირდებათ საკუთარი დანადგარები.

CosyVoice2 არის პრემიუმ დონის მოდელები და ღირს 25 კრედიტი 1000 სიმბოლოზე. ყველა ახალი ანგარიში იღებს უფასო სტარტის კრედიტებს, ასე რომ შეგიძლიათ CosyVoice2 ხმათა კლონირებას სცადოთ სანამ გადაწყვეტთ გადახდის გეგმას.

ორივე არის მაღალხარისხიანი ხმათა კლონირება. GPT- Sovits ხშირად აღწევს ერთეული ხმების უმაღლეს ნედლ მსგავსებას, ხოლო CosyVoice2 უფრო ძლიერია მრავალენოვანი და მრავალენოვანი კლონირებისთვის და ამატებს დაბალი ლოდინის სტრიმინგ რეჟიმს. აირჩიეთ CosyVoice2, თუ გჭირდებათ ერთი კლონირებადი ხმა რამდენიმე ენის საუბრისთვის.

ორივე მათგანი გთავაზობთ მაღალი ხარისხის ნულოვანი შოტის ხმათა კლონირებას. CosyVoice2 უზრუნველყოფს უფრო მეტ ენას (5 წინააღმდეგ 2) და რეალურ დროში გამოყენების სტრიმინგს, ხოლო F5- TTS შეიძლება იყოს ცოტათი უფრო სწრაფი მხოლოდ ინგლისური სამუშაოსთვის. მრავალენოვანი პროექტებისთვის CosyVoice2 ჩვეულებრივ უფრო იდეალურია.

TextToSpeechAI საშუალებას გაძლევთ CosyVoice2- ს თაობების ექსპორტი გავრცელებულ ფორმატებში, როგორიცაა MP3 და WAV. შეგიძლიათ ფაილის ჩამოტვირთვა თქვენი ისტორიის გვერდიდან ან მისი პროგრამული აღდგენა TextToSpeechAI API- ს საშუალებით.

დიახ. შეგიძლიათ CosyVoice2-ის ტესტირება უფასო დემო ვერსიით და უფასო კრედიტებით TextToSpeechAI-ზე, რაიმეს დაყენების გარეშე. უბრალოდ დარეგისტრირდით, ჩატვირთეთ მოკლე რეფერალური კლიპები, ჩაწერეთ თქვენი ტექსტი ნებისმიერ მხარდაჭერილ ენაზე და შექმნეთ.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try ხმა2Name Now

Generate your first audio free. No credit card required.

Start Free