ВИТС

Standard

Хөнгөн, төгсгөлөөс төгсгөл хүртэл TTS, байгалийн яриа

Very Fast Хурд
Good чанар
Үгүй Хослох
10 Хэл

Тодорхойлолт ВИТС

-to-end neural TTS model that generates natural-sounding speech. It combines variational autoencoders with adversarial learning for

Түлхүүр шинж чанарууд

Хурдан синтез

Хурдан яриа үүсгэхийн тулд төгсгөлөөс төгсгөл хүртэлх архитектур.

Бүтээгдэхүүний нэр

Олон текстийг нэг дор үр дүнтэй боловсруулна.

Нийгмийн яриа

VAE+GAN сургалт нь байгалийн хэмнэл, ритмийг бий болгодог.

Олон дуут

Нэг загвар нь олон дуут дууг дэмждэг.

Үр дүнтэй

Хөнгөн, сайн гүйцэтгэлтэй санах ойны хэрэглээ.

Нээлттэй эх

MIT лиценз бүхий бүх хэрэглээний нөхцөлд.

Ашиглах тохиолдол

Аудио үүсгэх багц Электрон сургалтын платформуудName Мэдээ унших Автомат мэдээллийн систем IVR системүүд Их дуутай агуулга

ВИТС Voices

View All 109
LJSpeech (English Female)
EN
VCTK Speaker 225 (English Female)
EN
VCTK Speaker 226 (English Male)
EN
VCTK Speaker 227 (English Male)
EN
VCTK Speaker 228 (English Female)
EN
VCTK Speaker 229
EN
VCTK Speaker 230
EN
VCTK Speaker 231
EN
VCTK Speaker 232
EN
VCTK Speaker 233
EN
VCTK Speaker 234
EN
VCTK Speaker 236
EN

Хэрхэн ашиглах вэ ВИТС

  1. 1

    Үнэгүй бүртгүүлэх эсвэл туршилт хийх

    TextToSpeechAI-ийн үнэгүй дансыг үүсгэж эхлэх зээл авах эсвэл бүртгүүлэхээс өмнө VITS-ийг сонсох зорилгоор хуудасны демог ашиглана уу.

  2. 2

    VITS дуу хоолой эсвэл дуут дамжуулагчийг сонгоно уу

    Хөгжим сонгох

  3. 3

    Таны бичлэгийг оруулна уу

    Хэлэх гэсэн үгээ редакторт бичнэ үү эсвэл хавсаргана уу. VITS нь урт хэсгүүдийг сайн хянадаг ба багц болон их хэмжээний агуулгад тохиромжтой.

  4. 4

    Дэлгэцийг үүсгэх

    VITS- ээр яриаг синтезлэхийн тулд үүсгэх товчийг дарна уу. VITS маш хурдан, стандарт түвшинтэй (1000 тэмдэгт тутамд 10 кредит) тул үр дүнг бага зардлаар хурдан гаргаж өгнө.

  5. 5

    API татаж авах эсвэл ашиглах

    MP3, WAV, OGG хэлбэрээр дууны файлыг татаж авах эсвэл TextToSpeechAI REST API- ээр VITS дууг дуудах замаар өөрийн програмд автоматаар үүсгэх.

ВИТС API

TextToSpeechAI REST API-г ашиглан програмчлалын хэлийг үүсгэх.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "VITS нь өндөр хэмжээтэй програмуудад хурдан, байгалийн яриаг хүргэдэг.",
    "voice": "vits-ljspeech"
  }'

Заримдаа асуудаг асуултууд

VITS (Variation Inference with adversarial learning for end- to- end Text- to- Speech) нь төгсгөлөөс төгсгөл хүртэлх нейрон TTS загвар бөгөөд хувирлын автокодлогчтой өрсөлдөгч GAN сургалтыг хослуулсан. Энэ нь нэг удаагийн давтамжтайгаар байгалийн дуугаралт үүсгэдэг, энэ нь хурдан, үр дүнтэй байдаг. Та VITS- ийг TextToSpeechAI дээр үнэгүй туршиж үзэх боломжтой.

Тийм ээ, VITS нь MIT лицензийн дор нээлттэй эх үүсвэртэй, тиймээс бүрэн хязгаарлалтгүйгээр бизнесийн зорилгоор ашиглах боломжтой. Энэ нь бизнесийн бүтээгдэхүүн, үйлчилгээнд өргөнөөр ашиглагддаг. TextToSpeechAI дээр VITS нь Стандарт түвшинд 1000 тэмдэгт бүрт 10 кредитийн үнэтэй.

TextToSpeechAI нь VCTK дууны багц, олон тооны Англи хэлний дууны багц, олон тооны дууны сантай. Нэг VITS загвар нь олон дууны багцтай, ингэснээр та хөдөлгүүрийг солихгүйгээр олон дуунаас сонгож болно.

VITS дэмжлэг нь сургасан загвараас хамаарна. Хамгийн түгээмэл VITS загварууд нь Англи, Хятад, Япон, Солонгос, Герман, Франц, бусад гол хэлүүдийг дэмждэг бөгөөд VCTK мэдээллийн сангаас олон хэлтний Англи хэлийг дэмждэг.

VITS маш хурдан, бодит цаг хугацаанд эсвэл график процессор дээр илүү хурдан яриа үүсгэдэг. Энэхүү төгсгөлөөс төгсгөл хүртэлх архитектур нь бусад загваруудын олон үйлдлийн шатыг арилгаж, VITS нь багц болон өндөр хэмжээтэй синтез хийхэд тохиромжтой.

Үгүй, VITS дууны клонлолтыг дэмждэггүй. Энэ нь сонгосон дууг түүвэрээс нь хуулбарлахын оронд урьдчилан бэлтгэсэн олон дуут хэмжигчийг ашигладаг. TextToSpeechAI дээр дууны клонлолт хийхэд F5- TTS эсвэл GPT- SoVITS ашиглана уу.

VITS нь өнгө, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл, хэмнэл,

VITS нь санах ойг хэмнэдэг, ерөнхийдөө хэдхэн ГБ-ын VRAM (4ГБ орчим) шаарддаг. Энэ нь хэрэглэгчийн GPU дээр амархан ажилладаг, TextToSpeechAI дээр бүх дүрслэл сервер дээр хийгддэг тул танд ямар ч тоног төхөөрөмж хэрэггүй.

VITS ба Piper нь TextToSpeechAI дээрх MIT- ийн лицензтэй стандарт түвшний хөдөлгүүрүүд юм. Piper нь хамгийн бага хүчин чадалтай, хамгийн хурдан сонголт бол VITS нь VCTK- ийг багтаасан олон дуут санд илүү нарийн хэмнэлтэй дууг санал болгодог. Хэлний дутууг дэмждэггүй.

VITS нь 1000 үсэг бүрт 10 кредитийн үнэтэй стандарт түвшний хөдөлгүүр юм. Энэ нь VITS загварын үр дүнтэй, хурдан чанарын ачаар бидний хамгийн хямд үнэтэй түвшин юм.

VITS нь 22050Hz-ийн дууг үүсгэдэг. TextToSpeechAI-аар дамжуулан MP3, WAV, OGG форматыг хүсч болно. Өөрчлөлт нь автоматаар хийгддэг.

TextToSpeechAI-д бүртгүүлээд үнэгүй эхлүүлэх кредит авах, дараа нь VITS дуугаралт сонгож, текстээ оруулж, аудио үүсгэх боломжтой. Та бүртгэлээ хийхээс өмнө VITS-ийг сонсох туршилтын хувилбарыг ашиглаж, бүртгүүлсний дараа REST API-г ашиглан VITS-д нэвтрэх боломжтой.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 10
  • GPU VRAM 1-2GB
  • Credits/1000 chars 10

Try ВИТС Now

Generate your first audio free. No credit card required.

Start Free