Өдрийн
UltraХэлний дутуугийн болон үггүй дууны тусламжтайгаар яриа руу чиглэсэн TTS
Тодорхойлолт Өдрийн
ing the most accurate text-to-speech results. Dia is the first text-to-speech model to use the 1.6B parameter text-to-speech model, which is the most widely used text-to-speech model in the world. Dia is the first text-to-speech model to use the 1.6B parameter text-to-speech model, which is the most widely used text-to-speech model in the world.
Түлхүүр шинж чанарууд
Диалогийн самбар үүсгэх
Өөр өөр дуу хоолой, эргэлттэй олон дуут яриаг бий болго.
Хэл бус дуунууд
[инээв], [хөлс], [хөлс], (хөлс)-ийг нэмэх нь байгалийн хэлний илэрхийлэл юм.
Дууны дугуй
5-10 секундын аудиог өөрийн дуу хоолойгоор солих
Нийгмийн яриа
1.6B параметрүүд нь маш байгалийн ярианы хэмнэл, интонацийн үр дүнг өгдөг.
Ашиглах тохиолдол
Хэрхэн ашиглах вэ Өдрийн
-
1
Үнэгүй бүртгүүлэх эсвэл туршилтын хувилбарыг нээнэ үү
Та эхлэх зээлийг авахын тулд үнэгүй TextToSpeechAI дансыг үүсгэх эсвэл бүртгэлгүй туршилтын хувилбарыг нээж Диа яриаг шууд туршиж үзээрэй.
-
2
Диа багцыг сонгох
ТТС-ийн удирдлагын самбар дээр хөдөлгүүрийн жагсаалтаас Dia-г сонгоно. Dia нь яриа, олон дуут болон дууны дуурайл дэмжлэг бүхий хэт өндөр түвшний загвар юм.
-
3
Сэдвийн хамт диалогын скрипт бичих
[S1] ба [S2] - ийг ашиглан яриагаа бичиж, яриачийн алхамыг тэмдэглэж, [инээв], [хөлс], [хөлсөх], эсвэл (хөлсөх) гэх мэт үггүй тэмдгийг оруулна.
-
4
Дэлгэцийг үүсгэх
Диа скриптийг GPU- нд илгээхийн тулд үүсгэх товчийг дарна уу. Диа нь хоёр дуут яриаг нэг аудио файлд оруулна.
-
5
API татаж авах эсвэл дуудах
Бүтсэн яриаг сонгосон хэлбэрээр татаж авах эсвэл TextToSpeechAI API-д өөрийн дансны түлхүүрээр [S1]/[S2] скриптийг илгээж автоматжуулах.
Өдрийн API
TextToSpeechAI REST API-г ашиглан програмчлалын хэлийг үүсгэх.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] Сайн уу! Өнөөдөр та яаж байна? [инээв] [S2] Би маш сайн байна, асуусанд баярлалаа!",
"voice": "en_US-lessac-medium"
}'
Заримдаа асуудаг асуултууд
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50