Ёқимли овоз2

Premium

Стрим қўллаб-қувватлаши билан Zero-shot кўп тилли овозни клонлаш

Fast Тезлик
Very Good Сифати
Ҳа Клонлаш
5 Тиллар

Маълумот Ёқимли овоз2

[Translation temporarily unavailable. Please try again.]

Ключа хусусиятлар

Zero-Shot овозни клонлаш

3-10 сониялик аудиодан юқори аниқлик билан овозни клонлаш.

Кўп тилли

Хитой, инглиз, япон, корейс ва кантон тилларини тиллараро синтез билан қўллаб-қувватлайди.

Стрим қўллаб-қувватлаши

Реал вақт дастурлари ва интерактив тизимлар учун паст латентликли стрийминг режими.

Табиий Прозоди

Олдга силжиган просодия моделлаштириши мос интонация билан табиий товушли сўзлашувни ҳосил қилади.

Ишлатиш ҳолатлари

Кўп тилли мазмун яратиш Реал вақтдаги овоз ёрдамчилари Тиллараро дубллаш Ўзингизнинг овоз дастурларингиз

Қўллаш усули Ёқимли овоз2

  1. 1

    Роҳхатдан ўтиш ва бепул кредитларни олиш

    Сизнинг бошланғич кредитларингизни олиш учун бепул TextToSpeechAI ҳисобни яратинг ёки аввал демони синаб кўринг. ГПУ ёки локал CosyVoice2 ўрнатиш керак эмас - ҳаммаси бизнинг инфратузилмамизда ишлайди.

  2. 2

    CosyVoice2 ни танланг ва манба клипни қўшинг

    CosyVoice2'ни ўзингизнинг двигателингиз сифатида танланг, сўнгра 3-10 сониялик тоза овоз ёзувини юклаб олинг. CosyVoice2 кўп тилли клонлаш учун сўзловчининг хусусиятларини ажратади.

  3. 3

    Матнни қўллаб-қувватланадиган тилда киритинг

    Скриптингизни Хитой, инглиз, япон, корейс ёки кантон тилида ёзинг ёки жойланг. CosyVoice2 тиллараро синтезни қўллаб-қувватлайди, шунинг учун клонланган овоз манбаий клипдан бошқа тилда гапириши мумкин.

  4. 4

    Товушни яратиш

    "Яратиш" тугмасини босинг ва CosyVoice2 табиий, кўп тилли сўзлашувни синтез қилади, одатда қисқа матн учун секундлар ичида. Premium-даражадаги фойдаланиш 1000 та белги учун 25 кредитга тушади.

  5. 5

    API юклаб олиш ёки фойдаланиш

    Ўтказилган аудиони MP3 ёки WAV форматида тарихингиздан юклаб олинг ёки TextToSpeechAI REST API орқали CosyVoice2 овозини автоматик тарзда кўчириб олинг.

Ёқимли овоз2 API

TextToSpeechAI REST API ёрдамида дастурий сўзлашув яратиш.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "CosyVoice2 овозни клонлаш қобилияти билан табиий кўп тилли сўзлашувни тақдим этади.",
    "voice": "en_US-lessac-medium"
  }'

Доимий сўраладиган саволлар

CosyVoice2 FunAudioLLM (Alibaba) дан келажак авлод матн-нутқ ва овозни клонлаш моделидир. У фақатгина бир неча сониялик аудиодан овозни клонлашни қўллаб-қувватлайди ва Хитой, инглиз, япон, корейс ва кантон тилларида табиий сўзлашувни синтезлаши мумкин. TextToSpeechAI'да сиз CosyVoice2'ни браузерда ҳеч қандай маҳаллий созламасиз ишга тушира оласиз.

Ҳа, CosyVoice2 тўлиқ Apache 2.0 лицензияси билан таъминланган - код ва моделлар учун ҳам. Бу уни лицензия тўловлари ёки нотижорат чекловларсиз савдо маҳсулотлари, тўловли мазмун ва клиент ишларида хавфсиз фойдаланишга имкон беради.

CosyVoice2 бешта тилни қўллаб-қувватлайди: Хитой (Мандарин), инглиз, япон, корейс ва кантон. У шунингдек, тиллараро синтезни ҳам қўллаб-қувватлайди, шунинг учун сиз бир тилдаги ёзувдан овозни клонлаб, бошқа тилда сўзлашувни яратишингиз мумкин.

Мақсадли овозли 3-10 сониялик тоза манба аудиосини тақдим этади. CosyVoice2 овозли хусусиятларни чекланган скаляр квантлаш усули ёрдамида ажратади, сўнгра қўллаб-қувватланадиган тиллардан бирида бу клонланган овозда янги сўзлашувни яратади. Модель тайёрлаш ёки яхшилаш талаб этилмайди.

CosyVoice2 кўп тилли клонлаш моделларидан бири бўлиб, ҳаттоки, тилга олинган видеоклипидан бошқа тилда сўзлашув яратилганда ҳам, сўзловчининг шахсийлигини сақлаб қолади. У табиий прозодия ва интонацияни ишлаб чиқаради, бу уни тиллараро дубляж ва локаллаштирилган мазмун учун яхши мослаштиради.

Ҳа. CosyVoice2 тезкор модел бўлиб, овоз ёрдамчилари ва интерактив дастурлар учун қулай бўлган, паст латентлик билан аудиони ишлаб чиқарадиган стрийминг режимини ўз ичига олади. TextToSpeechAI генерациялар одатда қисқа матн учун секундларда тугатилади.

CosyVoice2 0.5B параметр модели учун 4-6GB VRAM талаб қилади, шунинг учун 6GB ёки ундан кўпроқ GPU ўзи хост қилиш учун тавсия этилади. TextToSpeechAI модели GPU инфратузилмасида ишлайди, шунинг учун сизга ўзингизнинг жиҳозларингиз керак эмас.

CosyVoice2 Premium-даражали модел бўлиб, ҳар бир 1000 матн белгиси учун 25 кредитга тушади. Ҳар бир янги ҳисоб бепул старт кредитини олади, шунинг учун сиз CosyVoice2 овозни клонлашини тўловли планга қарор қабул қилишдан олдин синаб кўришингиз мумкин.

Иккаласи ҳам юқори сифатли овозни клонлаш моторларидир. GPT-SoVITS одатда бир мақсадли овоз учун энг юқори хом-ашё ўхшашлигига эришиши мумкин, CosyVoice2 эса кўп тилли ва тиллараро клонлаш учун кучлироқ ва паст латентлик стрийминг режимини қўшиб беради. Бир клонланган овозга кўп тилларни гапириш учун эҳтиёжингиз бўлса, CosyVoice2 ни танланг.

Иккаласи ҳам юқори сифатли овозни ўчириш овози клонлашини таклиф қилади. CosyVoice2 кўпроқ тилларни (5 га 2) қўллаб-қувватлайди ва реал вақтда фойдаланиш учун стриймингни қўшиб беради, F5-TTS эса фақат инглиз тилидаги иш юкламалари учун бироз тезроқ бўлиши мумкин. Кўп тилли лойиҳалар учун CosyVoice2 одатда яхшироқ.

TextToSpeechAI сизга MP3 ва WAV каби оддий форматларда CosyVoice2 авлодларини экспорт қилишга имкон беради. Файлни тарих саҳифангиздан тўғридан-тўғри юклаб олишингиз ёки TextToSpeechAI API орқали дастурий тарзда олишингиз мумкин.

Ҳа. Сиз CosyVoice2'ни бепул демо ва бепул старт кредитлари билан TextToSpeechAI'да ҳеч нарса ўрнатмасдан синашингиз мумкин. Фақат рўйхатдан ўтинг, қисқа мисолни юкланг, матнингизни қўллаб-қувватланадиган тилда ёзинг ва яратинг.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 4-6GB
  • Credits/1000 chars 25

Try Ёқимли овоз2 Now

Generate your first audio free. No credit card required.

Start Free