정보 편안한 목소리 2
[Translation temporarily unavailable. Please try again.]
주요 기능
제로 샷 음성 복제
3-10초의 참조 오디오에서 고품질로 어떤 목소리든 복제합니다.
다국어
중국어, 영어, 일본어, 한국어, 광둥어를 지원하며 언어간 합성이 가능합니다.
스트리밍 지원
실시간 애플리케이션 및 대화형 시스템을 위한 저지연 스트리밍 모드.
자연 음운
고급 음운 모델링은 적절한 억양으로 자연스럽게 들리는 음성을 생성합니다.
사용 사례
사용 방법 편안한 목소리 2
-
1
가입하고 무료 크레딧을 받으세요
무료 TextToSpeechAI 계정을 만들어 시작 크레딧을 요구하거나 데모를 먼저 시도하십시오. GPU 또는 로컬 CosyVoice2 설치가 필요하지 않습니다 - 모든 것이 우리의 인프라에서 실행됩니다.
-
2
CosyVoice2를 선택하고 참조 클립을 추가합니다.
엔진으로 CosyVoice2를 선택한 다음 클론화할 목소리의 깨끗한 3-10초 참조 녹음을 업로드하십시오. CosyVoice2는 제로 샷 다국어 클론화를 위해 스피커 특성을 추출합니다.
-
3
지원되는 모든 언어로 텍스트 입력
중국어, 영어, 일본어, 한국어 또는 광둥어로 스크립트를 입력하거나 붙여넣습니다. CosyVoice2는 언어간 합성을 지원하므로 복제된 음성은 참조 클립과 다른 언어로 말할 수 있습니다.
-
4
연설을 생성합니다
생성을 클릭하면 CosyVoice2가 짧은 텍스트의 경우 보통 몇 초 내에 복제된 음성에서 자연스러운 다국어 음성을 합성합니다. 프리미엄 계층 사용은 1,000 문자당 25 크레딧이 소요됩니다.
-
5
API 다운로드 또는 사용
완성된 오디오를 MP3 또는 WAV로 다운로드하거나 TextToSpeechAI REST API를 통해 규모에 맞게 CosyVoice2 음성 복제를 자동화할 수 있습니다.
편안한 목소리 2 API
TextToSpeechAI REST API를 사용하여 프로그래밍 방식으로 음성을 생성합니다.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "CosyVoice2는 제로 샷 음성 복제 기능으로 자연스러운 다국어 음성을 제공합니다.",
"voice": "en_US-lessac-medium"
}'
자주 묻는 질문
Technical Specs
- Generation Speed Fast
- Output Quality Very Good
- Voice Cloning Supported
- Languages 5
- GPU VRAM 4-6GB
- Credits/1000 chars 25