ВИТС

Standard

Тўғри гапириш билан тезкор охиридан охиригача TTS

Very Fast Тезлик
Good Сифати
Йўқ Клонлаш
10 Тиллар

Маълумот ВИТС

-to-end neural TTS model that generates natural-sounding speech. It combines variational autoencoders with adversarial learning for efficient synthesis. VITS is excellent for batch processing and applications requiring high-to-end neural TTS model that generates natural-sounding speech. It combines variational autoencoders with adversarial learning for efficient synthesis. VITS is excellent for batch processing and applications requiring

Ключа хусусиятлар

Тез синтез

Тез сўзлашув яратиш учун охиригача архитектура.

Партия ишлаш

Бир вақтда кўплаб матнларни самарали ишлаш.

Табиий сўзлашув

VAE+GAN машқлари табиий прозодия ва ритмни ҳосил қилади.

Кўп эшиттирувчи

Бир модел кўплаб сўзловчи овозларни қўллаб-қувватлайди.

Барқарор

Ёмон ишлаш билан паст хотира қуввати.

Очиқ манба

MIT лицензияси билан ҳар қандай ишлатишга мўлжалланган.

Ишлатиш ҳолатлари

Бачқа аудио яратиш E-Ўқиш платформалари Янгиликлар ўқигичлари Автоматик хабарлар IVR тизимлари Юқори овозли мазмун

ВИТС Voices

View All 109
LJSpeech (English Female)
EN
VCTK Speaker 225 (English Female)
EN
VCTK Speaker 226 (English Male)
EN
VCTK Speaker 227 (English Male)
EN
VCTK Speaker 228 (English Female)
EN
VCTK Speaker 229
EN
VCTK Speaker 230
EN
VCTK Speaker 231
EN
VCTK Speaker 232
EN
VCTK Speaker 233
EN
VCTK Speaker 234
EN
VCTK Speaker 236
EN

Қўллаш усули ВИТС

  1. 1

    Бепул рўйхатдан ўтинг ёки демони синаб кўринг

    TextToSpeechAI ҳисоб рақамини яратиб, старт кредитини олинг ёки саҳифадаги демодан фойдаланиб, VITSни эшитинг.

  2. 2

    VITS овози ёки динамигини танланг

    Товуш китобхонасини кўриб чиқинг ва VITS белгиси билан белгиланган овозни танланг. VCTK овоз берувчиси билан биргаликда кўп овозли VITS китобхонаси сизга кўплаб овозлардан танлаш имконини беради.

  3. 3

    Матнингизни киритинг

    Матнни ёзинг ёки редакторга ёзиб қўйинг. VITS узун абзацларни яхши бошқаради ва бу кўп сонли ва катта ҳажмдаги матнлар учун идеал.

  4. 4

    Аудио яратиш

    VITS билан сўзларни синтезлаш учун "Юклаб олиш" тугмасини босинг. VITS жуда тез ва стандарт даражали (1000 белги учун 10 кредит) бўлгани учун, натижа тез ва арзон қайтарилади.

  5. 5

    API юклаб олиш ёки фойдаланиш

    Яқинда тугалланган аудиони MP3, WAV ёки OGG шаклида юклаб олинг ёки ўз дастурингизда автоматик яратиш учун TextToSpeechAI REST API орқали шу VITS овозини чақиринг.

ВИТС API

TextToSpeechAI REST API ёрдамида дастурий сўзлашув яратиш.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "VITS тезкор, табиий сўзлашувни юқори ҳажмли дастурлар учун тақдим этади.",
    "voice": "vits-ljspeech"
  }'

Доимий сўраладиган саволлар

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) - бу ўзгарувчан автокодловчини рақобатчи GAN машғулоти билан бирлаштирган, охиригача нейронли TTS моделидир. У бир мартада табиий товушли сўзлашувни яратади, бу эса тез ва самарали. Сиз VITS'ни TextToSpeechAI'да бепул синашингиз мумкин.

Ҳа, VITS MIT лицензияси остида очиқ манбадир, шунинг учун у чекловларсиз тўлиқ савдо мақсадларида фойдаланишни қўллаб-қувватлайди. У савдо маҳсулотлари ва хизматларида кенг қўлланилади. TextToSpeechAI'да VITS стандарт даражасида ҳар 1000 белги учун 10 кредитга тушади.

TextToSpeechAI катта кўп-сўзловчи VITS китобхонасини тақдим этади, бунда VCTK овозлар тўплами ва ўнлаб инглиз тилидаги сўзловчилар ҳам мавжуд. Биргина VITS модели кўплаб сўзловчиларни қабул қилиши мумкин, шунинг учун сиз моторни алмаштирмасдан кўплаб турли овозлардан танлашингиз мумкин.

VITS қўллаб-қувватлаши ўргатилган моделга боғлиқ. Оддий VITS моделлари инглиз, хитой, япон, корейс, немис, француз ва бошқа асосий тилларни қамраб олади, VCTK маълумотлар тўпламидан кўп тилли инглиз тилларини қамраб олади.

VITS жуда тез, гапни реал вақтда ёки GPUда тезроқ ишлаб чиқаради. Унинг охиридан охиригача архитектураси бошқа моделларнинг кўплаб ишлаш босқичларини четлаб ўтади, шунинг учун VITS пакет ва катта ҳажмли синтез учун яхши мос келади.

Йўқ, VITS овозни клонлашни қўлламайди. У намунадан мақсад овозини нусхалаш ўрнига олдиндан тайёрланган кўп эшитгич моделларини қўллайди. TextToSpeechAI'да овозни клонлаш учун, унинг ўрнига F5-TTS ёки GPT-SoVITS'ни ишлатинг.

VITS табиий просодия ва ритмни яхши сифатли аудио билан ишлаб чиқаради. StyleTTS 2 ёки Tortoise даражасида бўлмаса ҳам, унинг тезлиги учун ажойиб сифатни, айниқса, партияли ишлаш учун таклиф қилади.

VITS хотира самарадорлигига эга, одатда фақатгина бир неча GB VRAM (тахминан 4GB) талаб қилинади. У истеъмолчи GPUларида қулай ишлайди, TextToSpeechAIда эса барча рендерлаш бизнинг серверларда амалга оширилади, шунинг учун сизга ўзингизнинг жиҳозингизга эҳтиёж йўқ.

VITS ва Piper иккаласи ҳам тезкор, MIT-лицензияланган TextToSpeechAI'даги Стандарт-даражали моторлардир. Piper энг енгил ва тезкор вариант, VITS эса катта кўп-сўзловчи китобхонасини (VCTK билан бирга) бир оз табиийроқ прозодия билан тақдим этади. Ҳеч бири овозни клонлашни қўлламайди.

VITS стандарт-даражали двигатель бўлиб, 1000 та ҳарф учун 10 кредитга тушади. Бу VITS моделининг самарали ва тезкор табиати туфайли бизнинг энг арзон нархли двигателимиздир.

VITS 22050Hz даги аудиони яратади. TextToSpeechAI орқали сиз MP3, WAV ёки OGG форматларини сўрашингиз мумкин, бу сиз учун автоматик тарзда амалга оширилади.

TextToSpeechAI рақамига бепул кредит олиш учун ёзилинг, сўнгра VITS овозини танланг, матн киритинг ва аудиони яратинг. Сиз ҳисоб яратишдан олдин VITSни эшитиш учун демодан ҳам фойдаланишингиз мумкин, ва VITSга ёзилганингиздан сўнг бизнинг REST API орқали киришингиз мумкин.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 10
  • GPU VRAM 1-2GB
  • Credits/1000 chars 10

Try ВИТС Now

Generate your first audio free. No credit card required.

Start Free