채터박스

Premium

23개 언어로 표현적인 음성을 가진 제로 샷 음성 복제

Fast 속도
Very Good 품질
복제
23 언어

정보 채터박스

[Translation temporarily unavailable. Please try again.]

주요 기능

제로 샷 음성 복제

몇 초의 오디오에서 어떤 음성을 복제하십시오 - 교육이 필요하지 않습니다.

23개 언어 지원

아랍어에서 중국어까지, 세계의 주요 언어를 다룹니다.

표현적 태그

자연적인 언어적 소리를 위해 [웃음], [기침], [웃음]을 추가합니다.

빠른 추론

실시간 애플리케이션을 위한 Turbo 버전으로 200ms 미만의 지연 시간.

사용 사례

콘텐츠 제작을 위한 음성 복제 다국어 음성 애플리케이션 게임용 캐릭터 음성 디자인 개인화된 음성 보조

사용 방법 채터박스

  1. 1

    가입하거나 데모를 열기

    무료 TextToSpeechAI 계정을 만들어 200개의 시작 크레딧을 받거나 로그인 없이 Chatterbox를 시험해 보려면 페이지에 있는 데모를 사용합니다.

  2. 2

    Chatterbox를 선택하고 참조 클립 추가

    Chatterbox 엔진을 선택한 다음 복제할 목소리의 짧은(몇 초) 오디오 클립을 업로드하십시오. Chatterbox Zero-Shot는 즉시 복제합니다. 교육이 필요하지 않습니다.

  3. 3

    선택적 태그를 사용하여 텍스트를 입력하십시오

    23개의 지원되는 언어 중 하나로 말하기 위해 텍스트를 입력하거나 붙여넣고, 원하는 자연스러운 언어보조 소리가 있는 곳에 [laugh], [cough], 또는 [chuckle] 태그를 드롭하십시오.

  4. 4

    연설을 생성합니다

    생성을 클릭하면 TextToSpeechAI이 호스팅된 GPU 인프라에서 클론화된 Chatterbox 음성으로 텍스트를 렌더링합니다. 1,000자당 25 크레딧이 소요됩니다.

  5. 5

    API 다운로드 또는 사용

    완성된 오디오 파일을 다운로드하거나 계정 토큰을 사용하여 api.texttospeechai.com의 TextToSpeechAI REST API를 통해 생성을 자동화합니다.

채터박스 API

TextToSpeechAI REST API를 사용하여 프로그래밍 방식으로 음성을 생성합니다.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Chatterbox는 오디오의 단 몇 초에서 당신의 목소리를 복제하고 23 개 언어로 말할 수 있습니다.",
    "voice": "en_US-lessac-medium"
  }'

자주 묻는 질문

Chatterbox는 Resemble AI의 제로 샷 음성 복제 텍스트-음성 모델입니다. 단지 몇 초의 참조 오디오로부터 어떤 음성도 복제할 수 있으며 23개 언어로 자연스럽고 표현력 있는 음성을 생성할 수 있습니다.

예, Chatterbox는 코드와 모델 가중치 모두 MIT 라이선스를 받아 상업용 제품에서 자유롭게 사용할 수 있습니다. 생성된 오디오에는 비활성화할 수 있는 선택적 신경 워터마크가 포함되어 있으며 사용 로열티가 없습니다.

몇 초만으로 충분한 어떤 목소리의 짧은 참조 클립을 제공하면 Chatterbox가 그 목소리의 음색과 스타일을 스피커 임베디드로 추출합니다. 그런 다음 미세 조정이나 훈련 단계 없이 그 목소리에서 완전히 새로운 음성을 생성합니다.

Chatterbox는 텍스트에서 특별한 인라인 태그를 읽어 자연스러운 비언어적 소리를 추가합니다. [laugh]는 웃음을 삽입하며, [cough]는 기침을 삽입하며, [chuckle]는 부드러운 웃음을 삽입합니다. 원하는 소리에 태그를 넣으면 됩니다. 예를 들어 "이건 웃기는 소리지만 진지하게..."

입력 텍스트에 태그를 직접 입력하세요. 소리가 나타나야 하는 곳에 태그를 입력하고 나머지 문장으로 둘러싸세요. Chatterbox는 복제된 음성에서 언어 외의 소리를 렌더링하여 주변 음성과 혼합하여 혼합되지 않고 자연스럽게 들리도록 합니다.

Chatterbox는 아랍어, 덴마크어, 독일어, 그리스어, 영어, 스페인어, 핀란드어, 프랑스어, 히브리어, 힌디어, 이탈리아어, 일본어, 한국어, 말레이어, 네덜란드어, 노르웨이어, 폴란드어, 포르투갈어, 러시아어, 스웨덴어, 스와힐리어, 터키어, 중국어 등 23개 언어를 지원합니다. 단일 복제 음성은 이러한 언어를 모두 사용할 수 있습니다.

Chatterbox는 GPU에서 빠르게 음성을 생성하며 Turbo 버전은 실시간 대화를 위해 200ms 미만의 지연 시간을 달성합니다. 품질은 매우 좋으며, 짧은 참조 클립에서도 자연스러운 음조와 충실한 음성 재생이 가능합니다.

Chatterbox는 변형에 따라 약 4-8GB의 VRAM이 필요하며 Turbo 모델은 4GB로 편안하게 실행됩니다. TextToSpeechAI에서는 로컬 GPU가 필요하지 않습니다. - 호스팅된 인프라에서 실행되는 세대입니다.

Chatterbox는 1,000자당 25 크레딧이 소요되는 프리미엄 엔진입니다. 새 계정은 음성 복제를 시도할 수 있는 200 크레딧을 무료로 받으며 실제로 생성한 텍스트에만 크레딧을 사용합니다.

둘 다 제로 샷 음성 복제를 지원하지만 Chatterbox는 훨씬 더 많은 언어(23 대 2)를 포함하고 표현적인 파랄링구스틱 태그를 추가합니다. F5-TTS는 약간 더 자연스러운 영어 음운을 극대화할 수 있으므로 다국어 복제 및 표현적인 소리를 위해 Chatterbox를 선택하고 영어 전용 충실도를 위해 F5-TTS를 선택하십시오.

Chatterbox는 23개의 언어와 인라인 표현 태그를 지원하며 OpenVoice는 Chatterbox가 없는 톤 스타일 컨트롤(친절, 슬픈, 화난 등)을 추가합니다. 광범위한 언어 커버리지를 위해 Chatterbox를 선택하고 명확한 감정 톤 스타일링이 필요할 때 OpenVoice를 선택하십시오.

무료 TextToSpeechAI 계정에 가입하여 200개의 시작 크레딧을 받거나 로그인하지 않고도 Chatterbox를 듣기 위해 페이지에 있는 데모를 사용합니다. 짧은 참조 클립을 업로드하고 텍스트를 입력하면 몇 초 만에 복제 음성이 생성됩니다.

Technical Specs

  • Generation Speed Fast
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 23
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try 채터박스 Now

Generate your first audio free. No credit card required.

Start Free