정보 날씨
ing the most accurate text-to-speech results for the most complex texts. Dia is a 1.6B parameter text-to-speech model that is designed to generate natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. It excels at generating the most accurate text-to-speech results for the most complex texts. Dia is a 1.6B parameter text-to-speech model that
주요 기능
대화상자 생성
독특한 음성과 턴테이킹으로 자연스러운 다중 스피커 대화를 생성합니다.
비언어적 소리
자연스러운 언어적 표현을 위해 [웃음], [탄식], [기침], (숨을 들이마신다)를 추가합니다.
음성 복제
개인화된 음성을 위해 5-10초의 참조 오디오에서 모든 음성을 복제합니다.
자연스러운 대화
1.6B 파라미터는 매우 자연스러운 대화 음운과 억양을 생성합니다.
사용 사례
사용 방법 날씨
-
1
무료로 가입하거나 데모를 열어보세요
무료 TextToSpeechAI 계정을 만들어 시작 크레딧을 주장하거나 Dia dialogue를 바로 시도하기 위해 가입 없는 데모를 엽니 다.
-
2
Dia 엔진 선택
TTS 대시보드에서 엔진 목록에서 Dia를 선택합니다. Dia는 다중 스피커 및 음성 복제 지원을 갖춘 대화 지향적이고 울트라 계층 모델입니다.
-
3
태그를 사용한 대화상자 스크립트 작성
[S1]와 [S2]를 사용하여 각 스피커 턴을 표시하고 [웃음], [탄식], [기침] 또는 (숨을 쉬는)과 같은 비언어적 태그를 자연스러운 반응을 원하는 곳에 드롭하여 대화를 작성하십시오.
-
4
오디오 생성
생성 을 클릭하여 Dia 스크립트를 호스팅된 GPU로 보냅니다. Dia는 턴테이킹과 비언어적 태그를 포함한 두 스피커 대화를 단일 오디오 파일로 렌더링합니다.
-
5
API 다운로드 또는 호출
선택한 형식으로 완성된 대화 상자를 다운로드하거나, 계정 토큰을 사용하여 TextToSpeechAI API에 동일한 [S1]/[S2] 스크립트를 게시하여 자동화합니다.
날씨 API
TextToSpeechAI REST API를 사용하여 프로그래밍 방식으로 음성을 생성합니다.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "[S1] 안녕하세요! 오늘은 어떠세요? [웃음] [S2] 괜찮아요, 질문해 주셔서 감사합니다!",
"voice": "en_US-lessac-medium"
}'
자주 묻는 질문
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 1
- GPU VRAM 10GB
- Credits/1000 chars 50