MeloTTS

Standard

Ātras multiacentās TTS ar dabisko prozodi

Very Fast Ātrums
Good Kvalitāte
Klonēšana
6 Valodas

Par MeloTTS

MeloTTS ir ātrs, daudzprocentīgs, teksts-to-speech modelis no MyShell AI. Tas atbalsta vairākas valodas ar autentisku akcentu variācijas angļu (Amerikāņu, Britu, Indijas, Austrālijas). MeloTTS darbojas reālā laikā ar CPU, padarot to efektīvu ražošanas ieviešanu.

Galvenās iezīmes

Vairāku līmeņu

Vairāki angļu akcenti: amerikāņu, britu, indiāņu un Austrālijas.

CPU reālā laika

Pietiekami ātri reālā laika sintēzei par CPU bez GPU.

6 Valodas

Atbalsta angļu, spāņu, franču, ķīniešu, japāņu un korejiešu.

Ātruma kontrole

Regulējams runāšanas ātrums precīzi pielāgotai izvadei.

Lietot gadījumus

Daudzkanālu balss lietojumprogrammas Starptautiskā satura lokalizācija Reālā laika balss asistenti Audiogrāmatas ražošana ar akcentu daudzveidību

Kā lietot MeloTTS

  1. 1

    Pierakstīties bezmaksas vai mēģināt demo

    Izveidot bezmaksas TextToSpeechAI konts, lai saņemtu startera kredītus, vai izmantot no-signup demo mājas lapā, lai pārbaudītu MeloTTS uzreiz. Bezmaksas kredīti ir pietiekami, lai novērtētu vairākus MeloTTS akcentus, pirms jūs apņematies.

  2. 2

    Izvēlieties MeloTTS akcentu un balsi

    Atveriet balss pārlūkprogrammu un filtrējiet uz MeloTTS. Izvēlieties akcentu, kas atbilst jūsu auditorijai, piemēram, amerikāņu, britu, indiešu vai Austrālijas angļu, vai dzimtā spāņu, franču, ķīniešu, japāņu vai korejiešu balss.

  3. 3

    Ievadiet tekstu

    Ierakstiet vai ielīmējiet skriptu, kuru vēlaties izrunāt teksta kastē. MeloTTS automātiski apstrādā dabisko prozodi, un jūs varat pielāgot runāšanas ātrumu, lai precīzi sakārtotu savu izvēlēto akcentu.

  4. 4

    Ģenerēt audio

    Noklikšķiniet ģenerēt un MeloTTS sintezē savu runu reālajā laikā. Jo tas darbojas efektīvi uz CPU, rezultāti atgriezties ātri pat ilgākas gājieni, un darba izmaksas 10 kredīti uz 1000 rakstzīmes.

  5. 5

    Lejupielādēt vai izmantot API

    Atskaņot rezultātu, pēc tam lejupielādēt audio failu jūsu vēlamo formātu no vēstures lapas. Lai automatizētu MeloTTS savā aplikācijā, zvaniet TextToSpeechAI REST API api.texttospeechai.com, izmantojot savu kontu API žetonu.

MeloTTS API

Ģenerēt runas programmēti, izmantojot TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "MeloTTS dabiski runā ar autentiskiem akcentiem no visas pasaules.",
    "voice": "en_US-lessac-medium"
  }'

Bieži uzdoti jautājumi

MeloTTS ir ātrs MyShell AI teksta to-speech modelis, kas specializējas daudzakustīgu runu sintēzē. Tas atbalsta vairākas valodas ar akcentu variācijām angļu valodā, radot dabisko prozodi reālā laikā.

Jā. MeloTTS tiek atbrīvots saskaņā ar MIT licenci, kas aptver gan kodu, gan modeļa svaru. To var brīvi izmantot komercproduktos bez autoratlīdzības vai piešķīruma prasībām.

MeloTTS atbalsta amerikāņu, britu, indiešu un Austrālijas angļu akcentus, kas ietver arī dzimtās balsis spāņu, franču, ķīniešu, japāņu un korejiešu valodā, padarot to piemērotu starptautiskajiem lietojumiem.

MeloTTS aptver sešas valodas: angļu, spāņu, franču, ķīniešu, japāņu un korejiešu. Angļu balsis pievienot autentiskus reģionālo akcentus uz bāzes valodas, tāpēc viens modelis apstrādā daudzus tirgus.

Jā. MeloTTS ir paredzēts reālā laika sintēzei un rada runu ātrāk nekā atskaņošana pat procesorā. Tas padara to spēcīgu piemērot dzīvu balss asistentiem, tērzēšanas robotiem un straumēšanas lietojumprogrammām.

MeloTTS rada labu, dabīgi skanīgu runu ar skaidru prozodi un precīzu akcentu. Tā ir prioritāte ātruma un akcenta dažādībai pār tādu lēnāku modeļu kā Styletts2 vai Tortoise īpaši augsto ticamību, tāpēc tas ir ideāli piemērots, ja reakcija ir vissvarīgākā.

Nē, MeloTTS nav klonēt balsis. Tā izmanto fiksētu komplektu iepriekš iestatītu skaļruņu un akcentiem. Balss klonēšanai uz TextToSpeechAI, izmantot F5-TTS, Chatterbox, CosyVoice2, OpenVoice, StyleTTS2, vai Tortoise vietā.

Nav nepieciešams GPU. MeloTTS darbojas ērti ar CPU, izmantojot aptuveni 500MB atmiņas un paliek reālā laikā. GPU ir fakultatīvs un tikai palielina ātrumu; ap 500MB VRAM ir pietiekami, ja jūs izvēlaties izmantot vienu.

MeloTTS ir standarta līmeņa motors par TextToSpeechAI, ko maksā 10 kredītpunkti uz 1000 rakstzīmēm. Tas ir zemākais cenu līmenis, kas atbilst citiem vieglajiem procesora modeļiem, piemēram, Piper, VITS, un Kokoro.

Gan MeloTTS, gan Kokoro ir ātri, MIT/Apache-licenzētie procesora modeļi standarta kredītlīmenī. Izvēlieties MeloTTS, kad jums ir nepieciešami atšķirīgi angļu akcenti (Amerikāņu, britu, Indijas, Austrālijas); izvēlieties Kokoro tās plašajai daudzvalodu balss daudzveidībai. Abi ir viegli A/B tests uz TextToSpeechAI.

MeloTTS ir izcils akcentu un daudzvalodu pārklājums, savukārt Piper piedāvā lielāko iepriekš iestatīto balss bibliotēku. Abi ir ātri un CPU spējīgi darboties standarta līmenī, tāpēc izvēlieties MeloTTS akcentiem specifiskiem projektiem un Piper, kad vēlaties visplašāko izvēli par atšķirīgām balsīm.

Yes. New TextToSpeechAI accounts include free starter credits, and there is a demo you can use without signing up. That is enough to test MeloTTS accents and voices before buying additional credits or subscribing.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 6
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try MeloTTS Now

Generate your first audio free. No credit card required.

Start Free