Dia

Ultra

TINA WA KUZUNGUMWA na sauti inayoibuka na sauti isiyosikika

Medium Mwendo
Excellent Ubora
Ndiyo Kuunganisha
1 Lugha

Habari Dia

Dia wa Nari Labs ni mzungumzaji wa parameta 1.6B (michoro ya parapact-to-speech). Ina ubora wa kutokeza usemi wa asili kwa kutumia sauti ya kawaida kama kicheko, mauguo, na kikohozi. Dia hutegemeza mazungumzo ya namna mbalimbali na sauti inayotokana na sauti ya sauti ya sekunde 5-10 za muziki, ikifanya inafaa kabisa kwa ajili ya kutokeza mazungumzo halisi na sauti za kiutuzi.

Sehemu Kuu

Kizazi Kinachopenda Kusoma na Kuandika

Panga mazungumzo ya asili ya ki-Msemaji na sauti tofauti na kugeuka.

Sauti Zisizo za Kikabila

Ongeza [vicheko], [kicheko], (micheko) kwa usemi wa asili wa kiruu.

Sauti Yaungana

Angeze sauti yoyote kutoka sekunde 5 hadi 10 za sauti ya marejezo kwa hotuba ya kibinafsi.

Mazungumzo ya Asili

Kwa kawaida, parameta 1.6 Selsiasi hutokeza mawimbi ya kiasili ya maneno na ya sauti.

Tumia Visa

Kitabu Dialogue and exating Utengenezaji wa mashine za muziki zenye herufi kadhaa Sauti za mimea Podikasti na uumbaji wa vitu vilivyo hai

Jinsi ya Kutumia Dia

  1. 1

    Tia alama kwenye ukurasa wa kwanza wa gazeti hili.

    Andaa akaunti huru TextToSpeechAI kudai sifa zako za mwanzo, au ufungue no-fip demo ili kujaribu mazungumzo ya Dia mara moja.

  2. 2

    Chagua injini ya Dia

    Katika TTSboboard anamchagua Dia kutoka kwenye orodha ya injini. Dia ni mfano wa watu wenye matatizo ya ki-Swahini na wanaotumia lugha mbalimbali na pia wa kupaza sauti.

  3. 3

    Andika maandishi ya ishara

    Andika mazungumzo yako kwa kutumia [S1] na [S2] kutia alama kila msemaji ageuka, na uondoe alama za maneno kama vile [vicheko], [kicheko], [kicheko] au (micheko) mahali unapotaka maitikio ya kiasili.

  4. 4

    Tete sauti

    Bonyeza inachochea kutuma maandishi yako ya Dia kwenye faili ya sauti ya GPUs. Dia anatafsiri mazungumzo hayo mawili ya lugha ya ishara na alama zako kwenye faili moja ya sauti.

  5. 5

    Pakia au piga simu API

    Pakua mazungumzo yaliyomalizika katika mtindo wako, au utumie mtandao kwa kuweka herufi zilezile [S1]/S2] kwa TextToSpeechAI API pamoja na ishara yako ya akaunti.

Dia API

Hotuba ya Genetea ikitumia mfumo wa reli wa TextToSpeechAI API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Basi leo nyinyi mnakwenda wapi? Na mimi kwa hakika nina nguvu na muaminifu.",
    "voice": "en_US-lessac-medium"
  }'

Maswali Ambayo Watu Huuliza Mara Nyingi

Dia ni mfano wa parate 176 za kiseyeye ambao una asili ya maneno kutoka Nari Labs. Inakuza usemi wa asili unaotegemeza wasemaji wengi, sauti zinazosikika kwa maneno yasiyosikika, na sauti inayoibuka.

Naam, Dia ana leseni kamili ya Waapache 2.0 - sheria na vilevile uzito wa namna ya kawaida.

Kwa sasa, Dia anaunga mkono Kiingereza pekee, na mfano huo unawafaa zaidi watu wanaozungumza Kiingereza.

Dia requires approximately 10GB of VRAM for its 1.6B parameter model. A GPU with at least 12GB is recommended for comfortable operation. On TextToSpeechAI all of this runs on our hosted GPUs, so you do not need any hardware of your own.

Kwa kubadilishana [S2] na kugeuka kwa herufi yako, Dia TTS hutokeza mazungumzo ya namna mbili yenye kufuatana na sauti tofauti na yenye uhalisi, ambayo ni vigumu kupata kwa kutumia mifano ya watu wanaoongea moja.

Kila mstari wa hati yako kwa [S1] au [S2] kutia alama ni nani anayeongea. Dia huhusianisha kila alama na kuweka kati ya nambari wakati mazungumzo yanapochukua hatua, kwa hiyo [S2] na kutenda kama wahusika wawili katika mazungumzo yenu.

Ndiyo. Dia anaunga mkono ufanyizaji wa sauti kutoka sekunde 5-10 hivi za sauti safi za muziki, akikuruhusu utumie sauti hususa kwa msemaji. Unaweza kuungana kutengeneza na alama za stina [S1]/S2] ili kila mhusika katika sauti kama sauti uliyoibuni.

Dia anafasiri [miche], [kicheko], [kicheko], na (micheko) kuwa sauti za asili za kiruu zilizofumwa katika usemi badala ya kusema maneno. Weka alama mahali unapotaka itikio - kwa mfano "[S1] Hilo ni kesho la kuchekesha" - kufanya mazungumzo yajihisi kuwa binadamu zaidi.

Dia na Bark wanaunga mkono sauti za kujieleza, lakini Dia inajengwa kwa ajili ya mazungumzo ya namna mbalimbali na [S1]/S2) kugeuka na kuzusha sauti. Chagua Dia kwa ajili ya mazungumzo ya watu wawili binafsi na kazi ya kiutu; Bark ni hali nzuri zaidi unapohitaji usambazaji wa lugha pana katika idhaa ya simu.

Dia ni injini ya hali ya juu sana, kwa hiyo inagharimu fedha 50 kwa kila herufi 1,000 za hotuba iliyotokezwa. Safu hiyo inaonyesha muundo wa 1.6B na kumbukumbu la GPU ambalo inatumia kwa ajili ya majadiliano ya hali ya juu.

Masimulizi ya New TextToSpeechAI yanatia ndani mikopo ya bure, na kuna taarifa ya makosa unayoweza kukimbia bila kutia sahihi.

Ndiyo. mara tu unapopata alama ya API ope kutoka ukurasa wako wa akaunti unaweza kuwasilisha maandishi ya lugha ya Dia - ikiwa ni pamoja na zamu na vitambulisho kama [mapungu] - kwa TextToSpeechAI RST API na kupakua programu ya kompyuta inayotokana na hilo.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try Dia Now

Generate your first audio free. No credit card required.

Start Free