情報 オープンボイス
of the voice and apply different tones to it. OpenVoice is a versatile instant voice cloning model that allows fine-grained control over speaking style, allowing you to take a look at the voice and apply different tones to it without new reference audio. OpenVoice is a versatile instant voice cloning model that allows fine-grained control over speaking style and apply different tones to the
主要な特徴
インスタントクローン
音声の数秒からどんな声でもクローンできます。
音色制御
喜び、悲しみ、怒り、興奮、ささやきの音を使う。
スタイル転送
音声アイデンティティを話し方から分離し,柔軟性を持たせる。
交叉語
異なる言語間でクローン音声を使用します。
ファストプロセッシング
音声生成のための効率的推論を提案した。
オープンソース
MITの商用ライセンス
ユースケース
使い方 オープンボイス
-
1
無料で登録するか、デモを試してみてください。
無料の TextToSpeechAI アカウントを作成して、スタートアップクレジットを得るか、ページ内のデモを使って OpenVoice をコミットする前に聞いてみてください。ローカル GPU やインストールが必要ありません。すべては我々のサーバで実行されます。
-
2
OpenVoice を選択し、参照クリップをアップロード
OpenVoice エンジンを選択し、数秒のクリーンな参照音声をアップロードして、目標の音声を即座にクローンします。OpenVoice は話者のアイデンティティを捕捉し、テキストや音声に対して再利用できます。
-
3
テキストを入力
クローン音声に聞かせたいスクリプトを入力または貼り付けてください。OpenVoice は約 10 言語とクロス言語提供をサポートします。参照クリップと異なる言語で書くことができます。
-
4
音色を選択し、生成します
OpenVoice の 9 つの音声スタイルのうち、デフォルト、友好的、喜び、興奮、悲しみ、怒り、恐怖、叫び、ささやきの 1 つを選択して生成します。同じクローン音声がその感情的な伝達で話します。
-
5
API をダウンロードまたは使用
音声をMP3、WAV、OGGとしてダウンロードするか、TextToSpeechAI APIを通して自動生成を行い、各要求にクローン音声とトーンスタイルを渡す。
オープンボイス API
Generate speech programmatically using the TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "OpenVoiceは喜び、悲しみ、さえもささやきといったどんな音でも話すことができる。",
"voice": "en_US-lessac-medium"
}'
よくある質問
Technical Specs
- Generation Speed Moderate
- Output Quality Very Good
- Voice Cloning Supported
- Languages 10
- GPU VRAM 3-6GB
- Credits/1000 chars 50