ゾーン

Ultra

感情とスタイル制御を備えた表現的な声のクローン化

Medium スピード
Excellent 品質
はい クローン
5 言語

情報 ゾーン

s.

主要な特徴

エモーションコントロール

音声感情は,喜び,悲しみ,怒り,恐怖,驚き,嫌悪,中立である。

音声クローン

5〜30秒の参照音声から高品質でどんな声もクローンする。

表現的言語

1.6Bパラメータは,微妙な感情伝達を伴う高い表現性の話を生成する。

多言語

英語、日本語、中国語、フランス語、ドイツ語をサポートします。

ユースケース

感情的表現コンテンツ作成 ゲームキャラクターの声 音声本のナレーション インタラクティブ・ボイス・エクスペリエンス

使い方 ゾーン

  1. 1

    登録またはデモを開く

    TextToSpeechAIの無料アカウントを作成して クレジットを得るか 登録なしのデモを使って すぐにZonosを試してみて

  2. 2

    ゾノスエンジンを選択

    音声とモデル選択から Zonos を選択します。音声をクローンするには、Zonos がスピーカーと一致するように 5-30 秒のクリーンな参照音声をアップロードしてください。

  3. 3

    テキストを入力

    話すスクリプトを入力または貼り付けます。Zonos は英語、日本語、中国語、フランス語、ドイツ語で動作します。

  4. 4

    感情を選んで 生成する

    ゾノスの感情を選択して、その感情を表現するために生成をクリックします。

  5. 5

    API をダウンロードまたは使用

    Play back and download the finished audio, or call the same Zonos engine programmatically through the TextToSpeechAI REST API for automated workflows.

ゾーン API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "ゾノスは感情を制御する 表現力のある言葉を生成する",
    "voice": "en_US-lessac-medium"
  }'

よくある質問

Zonosは Zyphra の 1.6B パラメータテキストから音声へのモデルです。 微細な感情制御と高信頼性の音声クローンを持つ表現的な音声生成を専門とします。TextToSpeechAI では、最も微妙で感情的な音声を生成するための超階層エンジンとして動作します。

はい。Zonosはコードとモデル重みの両方に対して Apache 2.0 ライセンスの下でリリースされており、商用製品に自由に使用できます。クレジットや非商用制限はありません。これは有料アプリケーション、クライアント作業、およびモネタリゼーションコンテンツに安全です。

Zonos は生成前に選択した中立、喜び、悲しみ、怒り、恐怖、驚き、嫌悪の 7 つの感情状態を表示します。モデルは選択した感情に基づいて、発信を条件付け、音調、ペース、音調を変更します。同じ文が喜びや怒りを表すこともできます。これは Zonos を特定の気分を必要とするキャラクターの声や対話に適しています。

Zonos は 7 つの感情オプションをサポートします: 中立、喜び、悲しみ、怒り、恐れ、驚き、嫌悪感。クリップ全体の感情的なトーンを設定するには、世代ごとに一つを選択します。

はい。Zonos は 5-30 秒の参照音声から声をクローンし、話者の特徴を抽出して新しい音声に再現します。クローンは 7 つの感情のいずれかと組み合わせて、クローンした声を幸せ、怒り、恐怖のような音にできます。

ゾノスは英語、日本語、中国語、フランス語、ドイツ語の5言語を扱い、感情制御と声のクローン化はこれらの言語で動作します。

ゾノスは1.6Bのパラメータサイズのために中速で動作し,生のスループットを交換して優れた高表現性の出力を得る。感情的な言語やクローン言語のための品質は最良の中であり,大量のリアルタイム生成よりも最終プロダクションオーディオに適している。

Zonos は 1.6B パラメータモデルに 8GB 以上の VRAM を必要とします。 音声クローンと感情制御を組み合わせた場合、快適な動作のために 10GB 以上の GPU を推奨します。TextToSpeechAI では、これらすべてが GPU バックエンドで実行されます。ハードウェアは必要ありません。

ゾノスは、1000文字当たり50クレジットで請求されるウルトラ・ティアエンジンである。ウルトラ・ティアは、 StyleTTS2、 Tortoise、 OpenVoice と同じような、大きなモデルと進んだ感情とクローン能力を反映している。

両方とも音声クローンを使ってスタイルと感情を制御します。Zonos は 7 つの独立した感情状態と現代的な 1.6B アーキテクチャを提供します。OpenVoice は非常に速い瞬時クローンで友好的、喜び、ささやきなどの音色を提供します。明確な感情選択と最大限の表現力を求める場合は Zonos を選択し、軽くて速い音色シフトを求める場合は OpenVoice を選択してください。

Bark は [笑い] や [息づく] のような表現マーカーを追加しますが、クローン機能は限られています。Dia は非言語的な音声を使った多人数の対話に焦点を当てています。Zonos は明示的な感情選択と強力な単一声音クローンを中心に、クリップごとの気分を正確にコントロールできます。エモーションタグ、対話のターン、選択可能な感情を必要とするかどうかに合ったエンジンを選択してください。

はい、新しいTextToSpeechAIアカウントは無料のスタートクレジットを得ます。デモでは、登録せずにサンプルオーディオを生成できます。それは、Zonosの感情制御と声クローンを試すのに十分です。追加クレジットを購入する前に。

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 5
  • GPU VRAM 8GB+
  • Credits/1000 chars 50

Try ゾーン Now

Generate your first audio free. No credit card required.

Start Free