Moderate
スピード
Very Good
品質
いや
クローン
1
言語
情報 パーラー
voices based on the text descriptions you specify. The voices are then used to generate the voices you want.
主要な特徴
テキスト説明
音声生成のための音声認識システムを開発した。
クリエイティブコントロール
年齢、性別、アクセント、スピード、話し方を指定してください。
ユニーク・ヴォイス
既に作成されているライブラリに存在しない音声を作成します。
自然出力
高品質で自然な音声を生成します。
効率的
音声生成のための高速推論を述べた。
オープンソース
Apache 2.0 は商用利用のためにライセンスされています。
ユースケース
声優
クリエイティブ・プロジェクト
プロトタイプ・ボイスオーバー
ゲーム開発
オーディオブックのキャラクター
カスタム音声作成
パーラー Voices
View All 10American Female
ENAmerican Male
ENBritish Female
ENBritish Male
ENCalm Voice
ENCheerful Voice
ENConversational Voice
ENFemale Narrator
ENMale Narrator
ENProfessional Voice
EN使い方 パーラー
-
1
無料で登録するか、デモを試してみてください。
200 スタータークレジットで無料の TextToSpeechAI アカウントを作成し、または登録なしで Parler-TTS を即座に試すためにデモを開きます。
-
2
Parler-TTS を選択し、音声説明を書きます
音声記述を書くには、 年齢、性別、アクセント、ペース、気分を含めて音声を作成します。
-
3
話すテキストを入力
話すスクリプトを入力または貼り付けてください。Parler-TTS はこのテキストを説明で定義された音声で表示します。説明とスクリプトを同じ言語で保存してください。 (英語が最も適しています)
-
4
音声を生成
生成をクリックして GPU バックエンドにジョブを送信します。Parler-TTS は、あなたの記述した音声に合った自然な音声を合成します。プレミアムレベルでは、1000文字当たり25クレジットで請求されます。
-
5
API をダウンロードまたは呼び出す
音声ファイルをMP3、WAV、OGGとしてダウンロードするか、テキストと音声記述を送信してTextToSpeechAI APIを通して自動生成する。
パーラー API
Generate speech programmatically using the TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "明るい若い女性がアメリカ訛りで話している。",
"voice": "parler-female_american"
}'
よくある質問
Parler-TTS はテキストの説明から音声を生成するテキストから音声へのモデルです。 既に作成されている音声を選択する代わりに、あなたが望むように説明します。例えば、「オーストラリア訛りの穏やかな成熟した女性が中程度のペースで話しています。」
Parler-TTSは Apache 2.0 ライセンスの下でオープンソースです。TextToSpeechAIでは、独自の音声生成機能に対して 1000文字あたり25クレジットを請求します。
Parler-TTS は主に英語をサポートします。音声記述は英語で最もよく動作しますが、モデルは様々な英語アクセント (アメリカ、イギリス、オーストラリアなど) を扱うことができます。
声の特徴を自然に記述する。
パーラーTTSは,GPU上での文当たり2〜5秒の中程度の生成速度を持ち,音声記述処理は実際の音声生成に比べて最小限のオーバヘッドを加える。
いえ、Parler-TTS は既存の音声をクローンするのではなく、説明から音声を生成します。音声クローンのためには StyleTTS2、F5-TTS、OpenVoice、または Tortoise を使用してください。
モデルサイズにより、Parler-TTSは4-8GBのVRAMを必要とします。ミニバージョンは4GBで動作します。フルモデルは最適な性能を得るために8GBを必要とします。
はい、Parler-TTSは Apache 2.0 ライセンスを受けており、商用利用も可能です。声は説明から生成されるので、声の所有権の問題はありません。
API 要求にテキストと共に声の説明を含めてください。API は説明を処理し、マッチした音声を生成します。お気に入りの説明を保存して再利用できます。
Parler-TTS は、あなたの声に合う韻律を持つ、非常に良い、自然に聞こえる音声を生成します。WAV をネイティブで出力し、TextToSpeechAI では自動変換を行って MP3、WAV、OGG としてダウンロードできます。
両方とも表現力のあるオープンソースエンジンですが、制御方法は異なります。Parler-TTS は単純なテキスト記述 (年齢、アクセント、ペース、気分) で音声を操作できます。Bark は [笑い] や音楽のような非言語的な情報を追加します。特定の記述音声を望む場合は Parler-TTS を、自発的な感情表現を望む場合は Bark を選択してください。
はい。TextToSpeechAI で無料アカウントに登録して 200 クレジットを受け取るか、デモを使ってアカウントなしで Parler-TTS を聴くことができます。クレジットパックを選ぶ前にいくつかの音声記述を試すのに十分です。
Technical Specs
- Generation Speed Moderate
- Output Quality Very Good
- Voice Cloning Not Supported
- Languages 1
- GPU VRAM 4-8GB
- Credits/1000 chars 25