Gün

Ultra

Ses klonlama və sözsüz səslərlə dialoq-oriented TTS

Medium Sür'ət
Excellent Keyfiyyət
Bəli Köçür
1 Dillər

Bağlan Gün

ing a 100% natural conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from 5-10 seconds of reference audio, making it ideal for creating realistic conversational speech with support for nonverbal sounds like laughter, sighs, and coughs. Dia supports multi-speaker dialogue generation and voice cloning from

Xüsusiyyətlər

Diaqramma

Təbii çoxlu-söhbətçi söhbətlərini fərqli səslərlə və dönmə ilə yaradın.

Sözsüz səslər

[laughs], [sighs], [coughs], (gasps) əlavə edin təbii paralingvistik ifadə üçün.

Seçki

Özəl səs üçün 5-10 saniyəlik səsi klonla.

Təbii söhbət

1.6B parametrləri çox təbii söhbət prozodiya və intonasiya istehsal edir.

İstifadə halları

Dialoq və söhbət yaratmaq Birdən çox xarakterli audiokitab istehsalı Oyun personajlarının səsləri Podcast və məzmun yaratma

Necə istifadə edilməlidir Gün

  1. 1

    Pulsuz qeyd olun ya da demo aç

    Dia dialoqunu dərhal sınamaq üçün qeydiyyatsız demonu açmaq üçün ya da start kreditlərinizi tələb etmək üçün pulsuz TextToSpeechAI hesabını yaradın.

  2. 2

    Dia motorunu seç

    TTS panelində motor siyahısından Dia seçin. Dia çoxlu səsləndirici və səs klonlaşdırma dəstəyi ilə dialoq-oriented, ultra-layer modeldir.

  3. 3

    Etiketlərlə dialoq skriptini yazın

    [S1] və [S2] istifadə edərək hər bir danışan dönməsini qeyd etmək üçün söhbətinizi yazın və [laughs], [sighs], [coughs], və ya (gasps) kimi sözsüz təyinatları təbii reaksiya istədiyiniz yerə atın.

  4. 4

    Audionu yarat

    Dia skriptinizi host GPU-lara göndərmək üçün yaratma düyməsini basın. Dia iki səsli dialoqu və sizin sözsüz işarələrinizi tək bir səs faylı halında göstərəcəkdir.

  5. 5

    API-ni yüklə və ya çağır

    Tamamlanmış dialoqu seçdiyiniz formatda yüklə, ya da eyni [S1]/[S2] skriptini hesab tokeni ilə TextToSpeechAI API-yə göndərərək avtomatikləşdir.

Gün API

TextToSpeechAI REST API-ni istifadə edərək proqramlaşdırma yolu ilə danışığı yarada bilərsiniz.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] Salam! Bu gün necəsiniz? [gülür] [S2] Çox yaxşıyam, soruşduğunuz üçün təşəkkür edirəm!",
    "voice": "en_US-lessac-medium"
  }'

Tez-tez Sorulan Sual

Dia Nari Labs-dan 1.6B parametrli dialoq-oriented mətn-söhbətə modeldir. Bir çox səsləndiricilər, sözsüz səslər və səs klonlaşdırması üçün dəstəklə təbii söhbət səsi yaratmaqda ixtisaslaşmışdır.

Bəli, Dia tam Apache 2.0 lisenziyalıdır - həm kod, həm də model ağırlığı. Ticari tətbiqlərdə azad istifadə edilə bilər.

Dia hazırda yalnız ingilis dilini dəstəkləyir. Model təbii ingilis danışıq dili üçün optimallaşdırılmışdır.

Dia 1.6B parametr modeli üçün təxminən 10GB VRAM tələb edir. Ən azı 12GB GPU rahat işləmə üçün tövsiyə olunur. TextToSpeechAI-də bütün bunlar bizim host GPU-larda işləyir, buna görə də öz hardveriniz lazım deyil.

Bəli - Dia-nın dialoq üçün yaradılması budur. Dia TTS, skriptinizdə [S1] və [S2] dönmələrini əvəzləyib, tək-dönmə TTS modelləri ilə əldə etmək çətin olan fərqli səslərlə və real dönmələrlə iki-oxumaçı danışığını yaradır.

Skriptinizin hər sətrinin əvvəlinə danışan şəxsi göstərmək üçün [S1] və ya [S2] əlavə edin. Dia hər bir işarə üçün bir səs ayırır və söhbət gedişində onlar arasında keçid edir, buna görə də [S1] və [S2] dialoqunuzda iki xarakter kimi davranır.

Bəli. Dia təxminən 5-10 saniyəlik təmiz səsdən səs klonlamasını dəstəkləyir, bu da sizə səsləndirici üçün müəyyən səsi yenidən istifadə etməyə imkan verir. Siz klonlamanı [S1]/[S2] təyinatçıları ilə birləşdirə bilərsiniz ki, bu zaman dialoqdakı hər bir xarakterin səsi klonladığınız səs kimi səslənsin.

Dia [gülür], [sözləyir], [kökləyir] və (qaşlayır) səsləri danışan sözlərdən daha çox danışığa daxil olan təbiət paralingvistik səsləri kimi göstərəcəkdir. Dialoqun daha insani görünməsi üçün reaksiyanı istədiyiniz yerə bir işarə qoyun - məsələn "[S1] Bu gülməli [gülür]".

Dia və Bark sözsüz səsləri dəstəkləyir, lakin Dia [S1]/[S2] ardınca gələn və səs klonlaşdırma ilə çoxlu-söhbətçi dialoqu üçün xüsusi hazırlanmışdır. İki nəfər arasında real söhbətlər və personaj işlərinə Dia'yı seçin; Bark tək səsli danışıqda geniş dil əhatəliliyinə ehtiyacınız olduğunda daha yaxşı uyğun gəlir.

Dia ultra-tier mühərrikidir, buna görə də 1000 yaradılmış səs xarakteri üçün 50 kreditə başa gəlir. Ultra-tier daha böyük 1.6B modeli və yüksək keyfiyyətli dialoq üçün istifadə etdiyi ~10GB GPU yaddaşını əks etdirir.

Bəli. Yeni TextToSpeechAI hesabları pulsuz başlanğıc kreditləri daxil edir və qeydiyyatdan keçmədən istifadə edə biləcəyiniz demo var. Bu, ödənişli planı seçmədən əvvəl [S1]/[S2] etiketləri ilə qısa Dia dialoqu yaratmaq üçün kifayətdir.

Bəli. Hesabınızdakı səhifədən API token-ini əldə etdikdən sonra Dia dialoq skriptlərini - [S1]/[S2] dönmə və [laughs] kimi etiketləri də daxil olmaqla - TextToSpeechAI REST API-yə göndərə və nəticədə səsi proqramlaşdırma yolu ilə yükləyə bilərsiniz.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try Gün Now

Generate your first audio free. No credit card required.

Start Free