ポケットTTS

Standard

CPU 上でリアルタイムで動作する超軽量の音声クローン

Very Fast スピード
Good 品質
はい クローン
2 言語

情報 ポケットTTS

Windows 10, 8.1, 8, 7, Vista, XP, 2000, 2003, 2008, 2010, 2013, 2016, 2019, 2020, 2021, 2022, 2023, 2024, 2025,

主要な特徴

超軽量

100Mパラメータ - 最小限のリソースでCPU上でリアルタイムで実行します。

音声クローン

5秒の音声から声をクローンする

CPU 上のリアルタイム

GPU が必要ありません。標準ハードウェアでリアルタイム速度で音声を生成します。

エッジ・レディ

移動機器,Raspberry Pi,組み込みシステムに十分小さい。

ユースケース

エッジとモバイルデプロイメント CPU上のリアルタイム音声アシスタント IoTと組み込みデバイス 低リソース音声クローン

使い方 ポケットTTS

  1. 1

    無料で登録するか、デモを試してみてください。

    無料の TextToSpeechAI アカウントを作成して、スタートクレジットを受け取るか、登録前に Pocket TTS を聞くためのデモを利用してください。GPU やローカルインストールは必要ありません。

  2. 2

    Pocket TTS を選択し、クローンする音声を追加します

    Pocket TTS をエンジンに選択し、5秒から10秒の短い参照クリップをアップロードしてその音声をクローンします。 Pocket TTS は完全に CPU 上で動作します。クローンは速く軽いものです。

  3. 3

    テキストを入力

    英語またはフランス語のテキストをタイプまたは貼り付けて話すことができます。 Pocket TTS は 1,000 文字当たり 10 クレジットの標準料金で請求しますので、文字数を気にしてください。

  4. 4

    音声を生成

    Pocket TTS は、テキストをクローン音声でリアルタイムで合成します。モデルは小さく CPU 効率が良いので、ほとんどのクリップは数秒で作成できます。

  5. 5

    API をダウンロードまたは使用

    完成したオーディオをダウンロードするか、アカウントトークンを使って api.texttospeechai.com の TextToSpeechAI REST API を通して自動生成を行います。API は、自分のアプリケーションに同じ Pocket TTS クローンと合成を暴露します。

ポケットTTS API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ポケットTTSは,CPU上でもリアルタイムで動作する音声クローンを提供する。",
    "voice": "en_US-lessac-medium"
  }'

よくある質問

Pocket TTSは,1億パラメータの超軽量テキスト・トゥ・スピーチモデルで,CPU上でリアルタイムで動作し,5秒の音声から音声クローンを行う。

Pocket TTS は CC-BY-4.0 でライセンスされています。商用利用は許可されます。商用アプリケーションで使用する場合は、Kyutai のクレジットを必要とします。

Pocket TTS は現在英語とフランス語をサポートしています。将来のリリースで他の言語も追加される可能性があります。

Pocket TTS は 100M のパラメータで、標準の CPU ハードウェア上でリアルタイム速度で動作します。GPU が必要なく、エッジデプロイメントやモバイルアプリケーションに適しています。

両方とも軽量で CPU でうまく動作します。 Pocket TTS は音声クローンをサポートしますが、Kokoro はサポートしていません。 Kokoro は多言語 (9 対 2) をサポートします。軽量な音声クローンが必要な場合は Pocket TTS を、多言語が必要な場合は Kokoro を選択してください。

5 秒間の参照音声を提供します。 Pocket TTS は話者の特徴を抽出し、その音声で新しい音声を生成します。参照音声が長いほど (10 秒まで) 品質が向上します。

はい。GPUを必要とするクローンモデルとは異なり、Pocket TTS は100Mパラメータフットプリントの小ささにより、完全に CPU 上でゼロショット音声クローンを実行します。ラップトップやシングルボードコンピュータでも短いクリップから音声をクローンできます。

Pocket TTSはCC-BY-4.0の下でリリースされています。使用や再配布するときは、Kyutaiを元の作成者としてクレジットする必要があります。「Kyutaiによる Pocket TTS で生成された音声」のような単純なクレジットは、商用と非商用の両方の使用に対してライセンスを満たします。

Pocket TTSは、GPUを必要としない標準CPU上でリアルタイムかそれ以上の速度で音声を生成します。これは、ライブ音声アシスタントやデバイス上での生成などの低遅延ユースケースに最も応答性の高いエンジンの一つです。

Pocket TTSは標準価格で、1000文字あたり10クレジットで販売されています。TextToSpeechAIで最も経済的な音声クローンオプションの一つです。

両方とも軽量で CPU に優しい標準的なエンジンです。Kokoro は音声クローンをサポートしていませんので、音声クローンが必要な場合は Pocket TTS を選択してください。特定の音声をクローンする必要がない場合は、より広い言語コアを必要とする場合は Kokoro を選択してください。

はい、新規TextToSpeechAIアカウントは無料のスタートクレジットを受け取ります。そして、サイト上のデモでは、コミットする前に Pocket TTSを聞くことができます。無料で登録し、短い参考クリップをアップロードし、クローン音声を数秒で生成します。

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try ポケットTTS Now

Generate your first audio free. No credit card required.

Start Free