パイパー・TTS

Standard

高速で軽量なニューラルテキスト・トゥ・スピーチ

Very Fast スピード
Good 品質
いや クローン
20 言語

情報 パイパー・TTS

ing the cloud. Piper is a

主要な特徴

超高速合成

Raspberry Pi のような低電力デバイスでもリアルタイムで音声を生成します。

CPU最適化

高価なGPUハードウェアを必要としない。

20以上の言語

20以上の言語を母語のような発音でサポートします。

オフライン操作

これはインターネット接続が必要なく完全にオフラインで動作する。

プライバシー・ファースト

すべての処理はローカルで行われます。テキストはデバイスを離れません。

オープンソース

活発なコミュニティ開発を行うMITライセンス下の完全オープンソースである。

ユースケース

スマートホームアシスタント アクセシビリティアプリケーション IVR電話システム 組み込みデバイス 教育用ソフトウェア オフラインアプリケーション

パイパー・TTS Voices

View All 101
Alan (Fast) (UK English)
EN_GB
Alan (UK English)
EN_GB
Alba (UK English)
EN_GB
Alejandro (Spanish (Mexico))
ES_MX
Amir (Persian)
FA_IR
Amy (Fast) (US English)
EN_US
Amy (US English)
EN
Anders (Danish)
DA_DK
Anna (Hungarian)
HU_HU
Arctic (US English)
EN_US
Arthur (UK English)
EN_GB
Artur (Slovenian)
SL_SI

使い方 パイパー・TTS

  1. 1

    無料で登録するか、デモを開く

    無料のTextToSpeechAIアカウントを作成してスタートクレジットを受け取るか、ページ内のデモを使ってログインせずに直ちにPiperを試してみてください。

  2. 2

    ピパーの音声を選択

    音声ライブラリを開き、Piperエンジンによるフィルタリングを行い、目標言語とアクセントに合った音声をプレビューして、正しいものを見つけます。

  3. 3

    テキストを入力または貼り付け

    テキストボックスに話すスクリプトを入力または貼り付けます。Piper は句読点や長い文を扱いやすく、段落全体をドラッグして入力できます。

  4. 4

    速度を調整し、生成

    プロジェクトに合った話し速度 (0.5x から 2.0x まで) を設定し、 生成をクリックして Piper が CPU で音声を数秒で合成するようにします。

  5. 5

    音声をダウンロードまたは API を呼び出す

    結果パネルからMP3、WAV、OGGとしてクリップをダウンロードします。または、同じPiperボイススラグを /v1/generate/REST エンドポイントに送信して自動化します。

パイパー・TTS API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ピパーにようこそ、高速で軽量な神経テキスト・トゥ・スピーチエンジン。",
    "voice": "en_GB-alan-low"
  }'

よくある質問

Piper は、書かれたテキストを自然な音声に変換する、速く軽量な神経テキストから音声エンジンです。効率的な CPU 推論に最適化された VITS に基づく深い学習モデルを使用し、Piper はエッジデバイス、オフラインツール、リアルタイムアプリケーションに適しています。TextToSpeechAI 上で Piper をブラウザで直接無料で試すことができます。

はい、PiperはMITライセンスの下で完全にフリーでオープンソースです。それゆえ、個人的なプロジェクトや商業的なプロジェクトに使用する場合は、ライセンス料金がかかりません。TextToSpeechAIでは、Piperをスタートクレジットで無料で試用できます。続けて使用する場合は、1000文字あたり10クレジットの費用がかかります。

はい、Piper は商用利用を明示的に許可する MIT License の下でリリースされています。Piper で生成したオーディオは、ロイヤリティを支払うことなく、商用製品、ビデオ、アプリケーション、サービスに使用できます。

Piperは英語(米国、英国、その他のアクセント)、スペイン語、フランス語、ドイツ語、イタリア語、ポルトガル語、オランダ語、ポーランド語、ロシア語など20以上の言語をサポートします。それぞれの言語にはTextToSpeechAI音声ライブラリから選択できる、いくつかの予め訓練されたPiper音声が含まれています。

Piperは、最も速いTTSエンジンの一つで、CPU上で快適に動作します。Raspberry Piでもリアルタイムで音声を合成できます。TextToSpeechAIでは、ほとんどのPiper要求は1秒以内にオーディオを返します。

Piper は音声クローンをサポートしていません。 訓練済みの音声モデルを使用します。サンプリングから特定の音声をクローンする必要がある場合は、代わりに F5-TTS や TextToSpeechAI 上の Chatterbox のようなクローンエンジンを使用してください。

ピパーはアシスタント、IVRシステム、ナレーション、アクセシビリティツールに適した明瞭で良質な音声を生成する。遅いプレミアムモデルほど高信頼性ではないが、速度と品質の比はほとんどの日常的な使用例において優れている。

グラフィックカードが必要ありません。Piperは CPU 上で動作するように設計され、メモリは数百メガバイトしか使いません。これは、Piper が専用のグラフィックカードがないオフラインや埋め込みシナリオに適している理由です。

はい、Piperは高速なローカル推論を実現するために作られ、音声モデルをダウンロードしたらインターネット接続なしで完全にオフラインで動作します。小さなフロントエンドとCPUのみの設計は、オフラインとデバイス上の音声のための最良の選択肢の一つとなります。

Piper と Kokoro は両方とも速く、CPU に優しい、声のクローン化がない標準的なエンジンです。Piper は非常に大きな多言語の声のライブラリを持ち、非常に軽量です。Kokoro はしばしば少し洗練された音を出します。それで、声の幅が広く、リソースが少ない場合は Piper を選び、より滑らかなデフォルトの声を求める場合は Kokoro を選びましょう。

Piper は標準価格の階層にあり、1000 文字あたり 10 クレジットがかかります。TextToSpeechAI で最も低い階層です。新規アカウントは無料のスタートクレジットを受け取ります。コミットする前に Piper を無料でテストできます。

音声ライブラリから Piper 音声を選択し、その音声スラグを API トークンを使って /v1/generate/ エンドポイントに渡します。REST API はオーディオをレンダリングし、ダウンロード URL を返します。MP3、WAV、OGG 出力を要求できます。

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 20
  • GPU VRAM 500MB
  • Credits/1000 chars 10

Try パイパー・TTS Now

Generate your first audio free. No credit card required.

Start Free