코코로

Standard

자연스러운 품질의 번개 빠른, 가벼운 TTS

Very Fast 속도
Good 품질
아니오 복제
9 언어

정보 코코로

[Translation temporarily unavailable. Please try again.]

주요 기능

초경량

82M 매개변수, ~300MB 모델 크기. 최소한의 리소스로 CPU에서 실행됩니다.

거의 실시간

GPU 가속 없이도 재생 속도보다 빠른 음성 생성

다중 언어

영어, 프랑스어, 스페인어, 힌디어, 일본어, 중국어, 이탈리아어, 포르투갈어, 한국어 지원.

보이스 블렌딩

두 개의 목소리를 혼합하여 독특한 목소리 조합을 만들 수 있습니다.

사용 사례

실시간 채팅봇 및 가상 지원자 라이브 스트리밍 텍스트 음성 변환 에지 배포 및 모바일 애플리케이션 대용량 배치 처리

사용 방법 코코로

  1. 1

    무료로 가입하거나 데모를 시도하십시오.

    무료 TextToSpeechAI 계정을 만들어 200 스타터 크레딧을 얻을, 또는 즉시 Kokoro를 듣고 가입 데모를 사용하십시오. 표준 계층은 Kokoro는 1000 문자 당 10 크레딧만 비용을 의미합니다.

  2. 2

    코코로 목소리 선택

    음성 브라우저를 열고 대상 언어로 Kokoro 음성을 선택합니다(영어에서 일본어 및 한국어까지 9개 지원). 또한 Kokoro 음성 혼합을 사용하여 두 음성을 사용자 지정 조합으로 혼합할 수 있습니다.

  3. 3

    텍스트 입력

    에디터에 텍스트를 입력하거나 붙여넣기 하면 음성으로 읽어 낼 수 있습니다. Kokoro는 가벼운 82M 매개변수와 실시간 엔진을 통해 긴 문장을 효율적으로 처리합니다.

  4. 4

    속도 조정 및 생성

    사용 사례에 맞게 재생 속도를 설정한 다음 생성을 클릭합니다. Kokoro는 실시간보다 빠른 오디오 렌더링을 제공하므로 언어가 거의 즉시 준비됩니다.

  5. 5

    API 다운로드 또는 사용

    완성된 오디오를 MP3 또는 WAV로 다운로드하거나 api.texttospeechai.com의 TextToSpeechAI REST API를 통해 일괄 및 실시간 워크로드를 위해 생성을 자동화할 수 있습니다.

코코로 API

TextToSpeechAI REST API를 사용하여 프로그래밍 방식으로 음성을 생성합니다.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Kokoro는 놀라운 속도와 효율성으로 자연스러운 음성을 제공합니다.",
    "voice": "en_US-lessac-medium"
  }'

자주 묻는 질문

Kokoro는 8200만 개의 파라미터만을 가지고 있는 초경량 텍스트 음성 변환 모델입니다. 작은 크기에도 불구하고 CPU에서도 거의 실시간으로 다양한 언어를 통해 자연스럽게 들리는 음성을 생성합니다.

네, Kokoro는 코드와 모델 가중치 모두 아파치 2.0 라이선스를 받았습니다. 제한 없이 상업적 응용 프로그램에서 자유롭게 사용할 수 있습니다.

Kokoro는 영어 (미국과 영국), 프랑스어, 스페인어, 힌디어, 일본어, 중국어, 이탈리아어, 포르투갈어, 한국어를 지원합니다.

Kokoro는 가장 빠른 TTS 모델 중 하나로서 CPU에서 실시간 재생 속도보다 빠른 속도로 음성을 생성하여 대화형 애플리케이션에 이상적입니다.

아니요, Kokoro는 음성 복제를 지원하지 않습니다. 음성 혼합 기능을 갖춘 음성 라이브러리를 사용합니다. 음성 복제를 위해 F5-TTS, Chatterbox, StyleTTS2, OpenVoice 또는 Tortoise를 사용합니다.

Kokoro는 두 개의 목소리를 혼합하여 독특한 조합을 만들 수 있습니다. 이를 통해 전통적인 목소리 복제 없이 사용자 지정 목소리 특성을 만들 수 있습니다.

두 모델 모두 빠르고 가벼운 모델입니다. Kokoro는 보다 현대적인 아키텍처를 가지고 있으며 음성 혼합을 지원하며 Piper는 더 큰 음성 라이브러리를 가지고 있습니다. 두 모델 모두 실시간 애플리케이션에 탁월합니다.

Kokoro는 CPU에서 실행되도록 설계되었으며 최소한의 자원을 필요로 합니다. 약 300MB입니다. GPU가 필요하지 않지만 GPU 가속이 더 빠른 처리를 위해 지원됩니다.

네. Kokoro는 CPU에서도 재생보다 빠른 속도로 음성을 생성하며 지연 시간이 매우 낮아 채팅봇, 음성 지원, 라이브 스트리밍에 탁월한 적합성을 자랑합니다. 82M 파라미터 크기로 메모리 사용량을 줄여 대용량 및 엣지 배포에 적합합니다.

음성 혼합은 두 개의 Kokoro 음성을 혼합하여 맞춤형 특성을 가진 독특한 조합을 만들 수 있습니다. 이것은 전통적인 음성 복제가 아닙니다. 샘플에서 특정한 사람을 재현할 수는 없지만 고정된 음성 라이브러리보다 더 많은 다양성을 제공합니다. TextToSpeechAI 편집기에서 직접 혼합을 실험할 수 있습니다.

두 엔진 모두 음성 복제 없이 빠르고 CPU 친화적인 표준 계층 엔진입니다. Kokoro는 가장 가볍고(약 300MB) 9개 언어의 음성 혼합을 지원하며 MeloTTS는 여러 영어 억양과 실시간 다국어 출력에 초점을 맞추고 있습니다. 가장 작은 크기와 혼합을 위해 Kokoro를 선택하십시오. 특정 억양이 필요할 때 MeloTTS를 선택하십시오.

Kokoro는 표준 계층 엔진으로, 1000자당 10 크레딧이 소요됩니다. TextToSpeechAI에서 가장 낮은 계층입니다. 새 계정은 200 크레딧을 무료로 받으므로 Kokoro를 지불하지 않고 시험할 수 있습니다. 이는 규모에 따라 고품질의 음성을 생성하는 가장 비용 효율적인 방법 중 하나입니다.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try 코코로 Now

Generate your first audio free. No credit card required.

Start Free