Dia

Ultra

Dialog-orientasi TTS dengan suara kloning dan suara nonverbal

Medium Kecepatan
Excellent Kualitas
Ya Kloning
1 Bahasa

Tentang Dia

Dia oleh Nari Labs adalah dialog parameter 1,6B yang berfokus pada model teks-to-peech. yang lebih unggul dalam menghasilkan percakapan alami dengan dukungan untuk nonverbal terdengar seperti tawa, mendesah, dan batuk. dia mendukung dialog multi-peactor generasi dan kloning dari 5-10 detik dari audio referensi, membuatnya ideal untuk menciptakan percakapan realistis dan suara karakter.

Fitur Kunci

Generasi Dialog

Hasilkan percakapan alami multi pembicara dengan suara yang berbeda dan mengubah-mengambil.

Suara Nonverbal

Tambahkan [tertawa], [mendesah], [batuk], (Terengah-engah) untuk ekspresi paralinguistik alami.

Penuturan Suara

Menduplikasikan suara apapun dari 5-10 detik dari referensi audio untuk berbicara pribadi.

Percakapan Alam

1.6B parameter menghasilkan prosody percakapan yang sangat alami dan intonasi.

Gunakan Kasus

Pembuat dialog dan percakapan Produksi buku audio dengan beberapa karakter Suara karakter permainan Pembuatan Podcast dan konten

Cara Menggunakan Dia

  1. 1

    Daftar bebas atau buka demo

    Create a free TextToSpeechAI account to claim your starter credits, or open the no-signup demo to try Dia dialogue right away.

  2. 2

    Pilih mesin Dia

    Dalam dashboard TTS memilih Dia dari daftar mesin. dia adalah dialog-orientasi, model ultra-tier dengan multi-pebicara dan dukungan penutupan suara.

  3. 3

    Tulis skrip dialog dengan tag

    Tulis percakapan Anda menggunakan [S1] dan [S2] untuk menandai setiap speaker berputar, dan jatuhkan pada tag nonverbal seperti [tertawa], [mendesah], atau (terengah-engah) di mana Anda ingin reaksi alami.

  4. 4

    Buat audio

    Klik hasilkan untuk mengirim skrip Dia Anda ke GPUs yang diberi host kami. Dia membuat dialog dua pembicara dengan mengambil balik dan tag nonverbal Anda menjadi satu berkas audio.

  5. 5

    Unduh atau panggil API

    Download the finished dialogue in your chosen format, or automate it by posting the same [S1]/[S2] script to the TextToSpeechAI API with your account token.

Dia API

Generate speech programmatically using the TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Halo, apa kabar hari ini? Terima kasih sudah bertanya!",
    "voice": "en_US-lessac-medium"
  }'

Pertanyaan yang Sering Diajukan

Dia adalah satu parameter dialog 1.6B berorientasi pada model teks-ke-pepeech dari Nari Labs. yang mengkhususkan diri dalam menghasilkan percakapan alami dengan dukungan untuk beberapa pembicara, suara nonverbal, dan kloning suara.

Ya, Dia adalah Apache 2.0 sepenuhnya dilisensikan - baik kode maupun berat model.

Dia hanya mendukung bahasa Inggris, modelnya dioptimalkan untuk berbicara secara natural dalam bahasa Inggris.

Dia requires approximately 10GB of VRAM for its 1.6B parameter model. A GPU with at least 12GB is recommended for comfortable operation. On TextToSpeechAI all of this runs on our hosted GPUs, so you do not need any hardware of your own.

Ya - dialog adalah apa yang Dia bangun dengan mengubah [S1] dan [S2] ternyata dalam naskah Anda, Dia TTS menghasilkan percakapan dua pembicara yang mengalir dengan suara yang berbeda dan realistik, yang lebih sulit untuk dicapai dengan model TTS pembicara tunggal.

Dia memberikan suara yang konsisten pada setiap tag dan mengganti keduanya sebagai percakapan, jadi [S1] dan [S2] bertindak sebagai dua karakter dalam dialog Anda.

Dia mendukung kloning suara dari sekitar 5-10 detik audio referensi bersih, memungkinkan Anda menggunakan kembali suara khusus untuk pembicara. Anda dapat menggabungkan kloning dengan [S1] /[S2] tag sehingga setiap karakter dalam dialog terdengar seperti suara yang Anda kloning.

Dia membuat [tertawa], [mendesah], dan (terengah-engah) sebagai suara paralinguistik alami yang ditenun ke dalam pidato bukan kata-kata diucapkan.

Baik Dia dan Bark mendukung ekspresif suara nonverbal, tapi Dia adalah tujuan-dibuat untuk dialog multi-pebicara dengan [S1] /[S2] back-taking dan kloning suara. Pilih Dia untuk percakapan nyata dua orang dan karakter kerja; Bark adalah cocok jika Anda membutuhkan cakupan bahasa yang lebih luas dalam narasi tunggal suara.

Dia adalah mesin ultra-tier, sehingga biaya 50 kredit per 1.000 karakter pidato yang dihasilkan. tingkat ultra mencerminkan model 1,6B yang lebih besar dan ~10GB memori GPU yang digunakan untuk dialog berkualitas tinggi.

Yes. New TextToSpeechAI accounts include free starter credits, and there is a demo you can run without signing up. That is enough to generate a short Dia dialogue with [S1]/[S2] tags before deciding on a paid plan.

Yes. Once you have an API token from your account page you can submit Dia dialogue scripts - including [S1]/[S2] turns and tags like [laughs] - to the TextToSpeechAI REST API and download the resulting audio programmatically.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try Dia Now

Generate your first audio free. No credit card required.

Start Free