樹皮

Premium

感情と音響効果を備えた表現的なAIスピーチ

Slow スピード
Very Good 品質
いや クローン
13 言語

情報 樹皮

-expressive sounds. Bark is a

主要な特徴

感情表現

笑い、息切れ、息切れ、真の感情で話を生成する。

感情マーカー

強調にはキャップを使い 躊躇するときは...

多言語

自然なアクセントと発音で13以上の言語をサポートします。

音楽と効果

音楽や環境音を生成する。

スピーカープレセット

音声の音声化を行うために,音声の音声化を行うための音声処理システムを開発した。

オープンソース

MITライセンスで商用利用権を持つ。

ユースケース

文字ダイアログ アニメーションコンテンツ オーディオブックナレーション ゲームボーイアドバンス クリエイティブ・プロジェクト 表現型アシスタント

樹皮 Voices

View All 130
Bark Chinese Speaker 0
ZH
Bark Chinese Speaker 1
ZH
Bark Chinese Speaker 2
ZH
Bark Chinese Speaker 3
ZH
Bark Chinese Speaker 4
ZH
Bark Chinese Speaker 5
ZH
Bark Chinese Speaker 6
ZH
Bark Chinese Speaker 7
ZH
Bark Chinese Speaker 8
ZH
Bark Chinese Speaker 9
ZH
Bark English Speaker 0
EN
Bark English Speaker 1
EN

使い方 樹皮

  1. 1

    無料で登録して デモを開く

    無料の TextToSpeechAI アカウントを作成して、スタートクレジットを要求するか、登録なしのデモを使って Bark を直接試してみてください。無料クレジットはアップグレードする前にいくつかの表現力のある Bark クリップを作成するのに十分です。

  2. 2

    ピック・ア・バーク・ボイス

    声のライブラリを開き、望む音に合った Bark スピーカープレセットを選択します。 Bark 音声はプレミアムレベル (1000 文字当たり 25 クレジット) でタグ付けされ、感情的なキャラクタースタイルのナレーションに調整されています。

  3. 3

    感情マーカーを含むテキストを入力

    スクリプトを入力し、 Bark 感情マーカーを行に埋め込みます。笑いは [laugh]、悲しみは [sighs]、息切れは [gasps]、休止は …、強調は CAPS。例: “ああ、すごい! [laugh] すごい!信じられない!”

  4. 4

    音声を生成

    生成をクリックすると、Bark はテキストを表現的な話し言葉に変換し、マーカーを対応する音に変換します。Bark の変換モデルのため、生成は軽量エンジンより遅いので、文ごとに数秒の余裕を持ってください。

  5. 5

    API をダウンロードまたは使用

    結果をプレビューし、MP3、WAV、OGG としてダウンロードします。自分のアプリケーションで Bark を自動化するには、Bark 音声と同じマーカーリッチテキストで TextToSpeechAI API を呼び出し、表現的なオーディオを取り戻します。

樹皮 API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "すごいな 表現力がすごい",
    "voice": "bark-zh_0"
  }'

よくある質問

Barkは、Sunoが開発した変換器ベースのテキストから音声へのモデルです。従来のTTSシステムとは異なり、Barkは自然な感情、笑い、息づかい、その他の非言語的な音を含む高度に表現力のある音声を生成します。音楽や音響効果も生成できます。

TextToSpeechAIでは、生成に必要なGPUリソースのため、1000文字あたり25クレジットを請求します。

Barkは英語、ドイツ語、スペイン語、フランス語、ヒンディー語、イタリア語、日本語、韓国語、ポーランド語、ポルトガル語、ロシア語、トルコ語、中国語など13以上の言語をサポートします。それぞれの言語は自然な発音とアクセントを持っています。

Barkは自動回帰変換アーキテクチャのため、ほとんどのTTSエンジンより遅い。典型的な文をGPUで生成するには5-15秒かかります。トレードオフは、より表現力のある自然な出力です。

Bark は意味的プロンプトとスピーカープレセットを通してのみ限定的な音声クローンを提供します。 だから、サンプルから任意の音声を信頼性の高いクローンを作成することはできません。完全な音声クローンを目指すなら、TextToSpeechAI で利用可能な F5-TTS、 StyleTTS2、 OpenVoice、 Tortoise を使ってください。

Bark はテキストに直接置かれた行間マーカーを読み、それらをマッチする音に変換します。笑いには [laugh]、息をつくには [sighs]、息をつくには [gasps]、... 躊躇や休止には [laughter]、強調には CAPS を使用してください。例: "Oh wow! [laugh] This is amazing... I can't believe it!"

単純な話し言葉の他に、Barkは笑い、息切れ、息切れ、喉の開き、口内発音などの非言語音を生成し、単純な音楽や環境効果を生成する。これらはテキストに埋め込まれた「笑い」、「息切れ」、「口内発音」などのマーカーでトリガーされ、これがBarkを標準のTTSよりも表現力のあるものにする。

Barkは人間の言葉に匹敵する自然な表現力を持つ非常に良質な音声を生成します。 24kHz出力はプロフェッショナルな音であるが、純粋な音声の質はStyleTTS2より少し下です。

Barkはモデルサイズに依存して8-12GBのVRAMを必要とします。フルモデルは約12GB、小型のバージョンは8GBで動作します。CPU推論は非常に遅く、推奨されません。

はい、Bark は MIT ライセンスで、商用利用は制限なく、ライセンス料は無料です。Bark を製品、サービス、アプリケーションに自由に使用できます。TextToSpeechAI では、登録クレジットを使ってBark を無料で試すことができ、さらに支払う前に使用できます。

Bark は [笑い] や [息づく] のような感情マーカーを持つ表現力のある単一話者の話に優れています。Dia は [S1]/[S2] の転換と非言語的な手掛かりを持つ多言語対話に作成されています。感情的な語りとキャラクターの声に Bark を、往復会話に Dia を選択してください。TextToSpeechAI では両方とも利用できます。

Bark は感情や非言語的な音を含む表現的な音声を生成する能力が特徴です。他のエンジンより遅いですが、クリエイティブなコンテンツのためにより人間的な結果を生成します。より速い合成には Piper を使用してください。声のクローンには F5-TTS または OpenVoice を使用してください。

Technical Specs

  • Generation Speed Slow
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 13
  • GPU VRAM 8-12GB
  • Credits/1000 chars 25

Try 樹皮 Now

Generate your first audio free. No credit card required.

Start Free