정보 오픈보이스
of the voice and apply different tones - cheerful, sad, angry, excited, or whispering - without new reference audio. OpenVoice is a versatile instant voice cloning model that allows fine-grained control over speaking style, allowing you to take a look at the voice and apply different tones - cheerful, sad, angry, excited, or whispering - without new reference audio.
주요 기능
즉각적인 복제
오디오의 단지 몇 초에서 어떤 목소리를 복제.
톤 제어
즐거운, 슬픈, 화난, 흥분, 또는 속삭이는 톤을 적용합니다.
스타일 전송
유연성을 위해 음성 정체성을 말하기 스타일과 분리합니다.
언어간 번역
다른 언어에서 복제된 음성을 사용합니다.
빠른 처리
신속한 음성 생성을 위한 효율적인 추론.
오픈 소스
MIT는 상업용으로 라이선스를 허가했다.
사용 사례
사용 방법 오픈보이스
-
1
무료로 가입하거나 데모를 시도하십시오.
무료 TextToSpeechAI 계정을 만들어 시작 크레딧을 받거나 페이지 데모를 사용하여 커밋하기 전에 OpenVoice를 듣습니다. 로컬 GPU 또는 설치가 필요하지 않습니다 - 모든 것이 우리의 서버에서 실행됩니다.
-
2
OpenVoice를 선택하고 참조 클립을 업로드합니다.
OpenVoice 엔진을 선택한 다음 몇 초의 깨끗한 참조 오디오를 업로드하여 대상 음성을 즉시 복제합니다. OpenVoice는 발음자 정체성을 캡처하여 모든 텍스트와 톤에서 재사용할 수 있습니다.
-
3
텍스트 입력
클론된 음성에서 말할 스크립트를 입력하거나 붙여넣습니다. OpenVoice는 약 10개의 언어와 크로스 언어 전송을 지원하므로 참조 클립과 다른 언어로 작성할 수 있습니다.
-
4
톤 스타일을 선택하고 생성
기본, 친절, 즐거움, 흥분, 슬픔, 화, 겁, 소리, 또는 속삭임 - 9 개의 OpenVoice 톤 스타일 중 하나를 선택하고 생성. 같은 복제 음성은 감정적 인 전달과 함께 말할 것입니다.
-
5
API 다운로드 또는 사용
MP3, WAV, OGG로 오디오를 다운로드하거나 각 요청에 복제된 음성과 톤 스타일을 전달하여 TextToSpeechAI API를 통해 생성을 자동화합니다.
오픈보이스 API
TextToSpeechAI REST API를 사용하여 프로그래밍 방식으로 음성을 생성합니다.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "OpenVoice는 행복, 슬픔, 심지어 속삭임과 같은 어떤 음색으로도 말할 수 있습니다.",
"voice": "en_US-lessac-medium"
}'
자주 묻는 질문
Technical Specs
- Generation Speed Moderate
- Output Quality Very Good
- Voice Cloning Supported
- Languages 10
- GPU VRAM 3-6GB
- Credits/1000 chars 50