포켓 TTS

Standard

CPU에서 실시간으로 실행되는 초경량 음성 복제

Very Fast 속도
Good 품질
복제
2 언어

정보 포켓 TTS

Windows 10, 8.1, 8, 7, Vista, XP, 2000, 2003, 2008, 2010, 2013, 2016, 2019, 2020, 2021, 2022, 2023, 2024, 2025,

주요 기능

초경량

100M 매개변수 - 최소한의 자원으로 CPU에서 실시간으로 실행됩니다.

음성 복제

CPU에서도 5초의 참조 오디오로 모든 음성을 복제할 수 있습니다.

CPU에서 실시간

GPU가 필요하지 않습니다. 표준 하드웨어에서 실시간으로 음성을 생성합니다.

에지 준비됨

모바일 장치, Raspberry Pi 및 임베디드 시스템에 적합한 작은 크기.

사용 사례

에지 및 모바일 배포 CPU에서 실시간 음성 조수 IoT 및 임베디드 장치 저리소스 음성 복제

사용 방법 포켓 TTS

  1. 1

    무료로 가입하거나 데모를 시도하십시오.

    무료 TextToSpeechAI 계정을 만들어 시작 크레딧을 받거나, 가입하기 전에 Pocket TTS를 듣기 위해 현장 데모를 사용합니다. GPU 또는 로컬 설치가 필요하지 않습니다.

  2. 2

    Pocket TTS를 선택하고 복제할 음성을 추가합니다.

    Pocket TTS를 엔진으로 선택한 다음 5~10초의 짧은 참조 클립을 업로드하여 음성을 복제합니다. Pocket TTS는 CPU에서 전적으로 실행되므로 복제가 빠르고 가볍습니다.

  3. 3

    텍스트 입력

    말하고 싶은 영어 또는 프랑스어 텍스트를 입력하거나 붙여넣습니다. Pocket TTS는 1,000자당 10 크레딧의 표준 요금으로 청구되므로 문자 수를 주의하십시오.

  4. 4

    오디오 생성

    Pocket TTS는 텍스트를 실시간으로 복제된 음성으로 합성합니다. 모델이 작고 CPU 효율적이기 때문에 대부분의 클립은 몇 초 만에 준비됩니다.

  5. 5

    API 다운로드 또는 사용

    완성된 오디오를 다운로드하거나 계정 토큰을 사용하여 api.texttospeechai.com의 TextToSpeechAI REST API를 통해 생성을 자동화합니다. API는 자신의 앱에 동일한 Pocket TTS 클론 및 합성을 노출합니다.

포켓 TTS API

TextToSpeechAI REST API를 사용하여 프로그래밍 방식으로 음성을 생성합니다.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Pocket TTS는 CPU에서 실시간으로 실행되는 음성 복제를 제공합니다.",
    "voice": "en_US-lessac-medium"
  }'

자주 묻는 질문

Pocket TTS는 1억 개의 파라미터만을 가지고 있는 Kyutai의 초경량 텍스트-음성 모델로 CPU에서 실시간으로 실행되며 5초의 오디오에서 음성 클론을 지원합니다.

Pocket TTS는 CC-BY-4.0 라이선스로 제공되며, 크레딧을 첨부하여 상업적 사용을 허용합니다. 상업적 응용 프로그램에서 사용할 때는 Kyutai 크레딧을 첨부해야 합니다.

현재 포켓 TTS는 영어와 프랑스어를 지원합니다. 향후 릴리스에서 더 많은 언어가 추가 될 수 있습니다.

Pocket TTS는 100M 파라미터만으로 표준 CPU 하드웨어에서 실시간으로 실행됩니다. GPU가 필요하지 않으므로 엣지 배포 및 모바일 애플리케이션에 이상적입니다.

둘 다 가볍고 CPU에서 잘 실행됩니다. Pocket TTS는 음성 복제를 유일하게 지원합니다 (Kokoro는하지 않습니다). Kokoro는 더 많은 언어를 지원합니다 (9 대 2). 가벼운 음성 복제가 필요하면 Pocket TTS를 선택하십시오.

5초의 참조 오디오를 제공합니다. Pocket TTS는 발음자 특성을 추출하여 해당 음성에서 새로운 음성을 생성할 수 있습니다. 참조 시간이 길면(최대 10초) 품질이 향상됩니다.

GPU가 필요한 대부분의 클론 모델과 달리 Pocket TTS는 100M의 매개변수 페이지 뷰를 갖추고 있어 CPU에서 완전히 제로샷 음성 클론을 수행합니다. 노트북이나 단일 보드 컴퓨터에서도 짧은 클립에서 음성을 클론할 수 있습니다.

Pocket TTS는 CC-BY-4.0 라이선스로 배포되므로, 사용 또는 재배포할 때는 큐타이를 원작자로 명시해야 합니다. "큐타이가 Pocket TTS로 생성한 음성"과 같은 간단한 명시는 상업적 및 비상업적 사용에 대한 라이선스를 만족시킵니다.

Pocket TTS는 GPU가 필요 없이 표준 CPU에서 실시간 또는 그 이상의 속도로 음성을 생성합니다. 이는 라이브 음성 지원 및 온디바이스 생성과 같은 저지연 사용 사례에 가장 응답성이 뛰어난 엔진 중 하나입니다.

Pocket TTS는 표준 가격대에 있으며, 1,000자당 10 크레딧이 소요됩니다. 이는 TextToSpeechAI에서 사용할 수 있는 가장 경제적인 음성 복제 옵션 중 하나입니다.

둘 다 가볍고 CPU 친화적이며 표준 수준의 엔진입니다. 음성 복제가 필요할 때 Pocket TTS를 선택하세요. Kokoro는 음성 복제를 지원하지 않습니다. 언어 범위가 넓고 특정 음성을 복제할 필요가 없을 때 Kokoro를 선택하세요.

네, 새로운 TextToSpeechAI 계정은 무료로 시작 크레딧을 받으며, 사이트 데모를 통해 약속하기 전에 Pocket TTS를 들을 수 있습니다. 무료로 등록하고 짧은 참조 클립을 업로드하고 몇 초 만에 클론된 음성을 생성하십시오.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try 포켓 TTS Now

Generate your first audio free. No credit card required.

Start Free