TTS 2- р хэв маяг
UltraХүний түвшний үсэгнээс яриа руу шилжүүлэхComment
Тодорхойлолт TTS 2- р хэв маяг
s. StyleTTS 2 is the first TTS system to use the
Түлхүүр шинж чанарууд
Хүний түвшний чанар
Бусад хүмүүсээс ялгагдахгүй яриаг бүтээх.
Стиль шилжүүлэх
Ямар ч аудио жишээнээс ярианы хэв маягийг шилжүүлэх.
Уран үг
Диффузын загварчлал дээр суурилсан төгс ритм, стресс, интонацийн загвар.
Дууны дугуй
Дуу хоолойг онцгой нарийвчлалтай, байгалийн байдлаар клонлох.
Хурдан дүгнэлт
Авторегрессив загвараас хурдтай чанарыг хадгалсан.
Нээлттэй эх
MIT лиценз бүхий бүрэн бизнесийн ашиглах эрхтэй.
Ашиглах тохиолдол
TTS 2- р хэв маяг Voices
View All 6StyleTTS2 Default
ENStyleTTS2 Expressive
ENStyleTTS2 Fast
ENStyleTTS2 Natural
ENStyleTTS2 Neutral
ENStyleTTS2 Quality
ENХэрхэн ашиглах вэ TTS 2- р хэв маяг
-
1
Үнэгүй бүртгүүлэх эсвэл туршилт явуулах
Үнэгүй TextToSpeechAI дансыг үүсгэн эхлэх кредит авах эсвэл бүртгэлээс гарахгүйгээр StyleTTS2-г сонсох зорилгоор эхний хуудасны туршилтыг ашиглана уу.
-
2
Хуваалцах
StyleTTS2 дуу хоолойг дууны сангаас сонгоно. Хөгжмийн дуу хоолойг дуурайлгахын тулд 10- 30 секундын сэдэв татаж аваад StyleTTS2- ийн аргаар үүнийг шилжүүлнэ.
-
3
Таны бичлэгийг оруулна уу
Скриптийг бичсэн эсвэл хадгал. StyleTTS2 нь Англи хэл дээр сайн ажилладаг ба урт хэсгүүдийн хувьд өнгө, өнгөний хэм, интонаци зэргийг харуулдаг.
-
4
Дэлгэцийг үүсгэх
Бүтээгдэхүүн үүсгэх товчийг дарахад TextToSpeechAI нь таны StyleTTS2 аудиог график процессор дээр харуулна. Ультра түвшний StyleTTS2 нь 1000 тэмдэгт бүрт 50 кредитийн үнэтэй.
-
5
API татаж авах эсвэл ашиглах
MP3, WAV, OGG хэлбэрээр дууны дууг татаж авах эсвэл TextToSpeechAI API-г StyleTTS2 дуугаар дуудан автоматаар үүсгэх.
TTS 2- р хэв маяг API
TextToSpeechAI REST API-г ашиглан програмчлалын хэлийг үүсгэх.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "StyleTTS 2 нь яриаг маш нарийн, мэргэжлийн хүний бичлэгтэй өрсөлдөхүйц байдлаар гаргадаг.",
"voice": "styletts2-default"
}'
Заримдаа асуудаг асуултууд
Technical Specs
- Generation Speed Moderate
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 4-6GB
- Credits/1000 chars 50