MeloTTS

Standard

Rask fleraksen TTS med naturlig prosodi

Very Fast Hastighet
Good Kvalitet
Nei Kloning
6 Språk

Om MeloTTS

MeloTTS er en hurtig, flerpasset tekst- til- tale- modell fra MyShell AI. Den støtter flere språk med autentiske aksentvariasjoner for engelsk (amerikansk, britisk, indisk, australsk). MeloTTS kjører i sanntid på CPU, noe som gjør det effektivt for produksjonsutbygginger.

Nøkkelfunksjoner

Flerakslede

Flere engelske aksenter: Amerikansk, Britisk, Indiansk og Australsk.

CPU sanntid

Rask nok til å bruke sanntidssyntese på CPU uten GPU.

6 språk

Støtter engelsk, spansk, fransk, kinesisk, japansk og koreansk.

Hastighetskontroll

Justerbar talehastighet for finjustert utgangshastighet.

Brukstilfeller

Flerer granne taleanvendelser Internasjonal lokalisering av innhold Stemmeassistenter i sanntid Lydbokproduksjon med aksentvariasjoner

Bruksmåte MeloTTS

  1. 1

    Registrer deg gratis eller prøv demoen

    Lag en gratis TextToSpeechAI konto for å motta startpoeng, eller bruk demon uten signering på hjemmesiden for å teste MeloTTS med en gang. Gratis kreditter er nok til å evaluere flere MeloTTS- aksenter før du sender inn.

  2. 2

    Velg en MeloTTS- aksent og stemme

    Åpne taleleseren og filtrer til MeloTTS. Velg aksent som passer ditt publikum, slik som amerikansk, britisk, indisk eller australsk, eller en naturlig spansk, fransk, kinesisk, japansk eller koreansk stemme.

  3. 3

    Skriv inn teksten

    Skriv inn eller lim inn skriptet du vil ha snakket inn i tekstboksen. MeloTTS håndterer naturlig prosodi automatisk, og du kan justere talehastigheten til finjustering for den aksenten du har valgt.

  4. 4

    Lag lyd

    Trykk Lag og MeloTTS syntetiserer snakken din i sanntid. Fordi den kjører effektivt på CPU, så kommer resultatene tilbake fort selv for lengre perioder, og jobben koster 10 poeng per 1000 tegn.

  5. 5

    Last ned eller bruk API

    Play back the result, then download the audio file in your preferred format from the history page. To automate MeloTTS in your own app, call the TextToSpeechAI REST API at api.texttospeechai.com using your account API token.

MeloTTS API

Generer taleprogrammatisk ved å bruke TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "MeloTTS snakker naturlig med autentiske aksenter fra hele verden.",
    "voice": "en_US-lessac-medium"
  }'

Ofte stilte spørsmål

MeloTTS er en rask tekst- til- tale- modell fra MyShell AI som spesialiserer seg på fleraksisk talesyntese. Den støtter flere språk med flere aksent- variasjoner for engelsk, og gir naturlig prosodi i sanntid.

Ja. MeloTTS blir frigitt i henhold til MIT- lisensen, som dekker både koden og modellvektene. Du kan bruke den fritt i kommersielle produkter uten royalties eller krav til tildeling.

MeloTTS støtter amerikansk, britisk, indisk og australsk engelsk aksent. Den inkluderer også innfødte stemmer for spansk, fransk, kinesisk, japansk og koreansk, noe som gjør det godt egnet til internasjonale anvendelser.

MeloTTS dekker seks språk: engelsk, spansk, fransk, kinesisk, japansk, og koreansk. De engelske stemmene legger til autentiske regionale aksenter over basisspråket, så en enkelt modell håndterer mange markeder.

Ja. MeloTTS er laget for sanntidssyntese og lager tale raskere enn avspilling selv på CPU. Dette gjør det godt egnet for lydassistenter, chatbotter og programmer for streaming.

MeloTTS gir god, naturlig klingende tale med klar prosodi og nøyaktig aksent. Det prioriterer hastighet og aksent variasjon over den ultrahøye troverdigheten til langsommere modeller som StyleTTS2 eller Tortoise, så det er ideelt når responsen er av betydning.

No, MeloTTS does not clone voices. It uses a fixed set of preset speakers and accents. For voice cloning on TextToSpeechAI, use F5-TTS, Chatterbox, CosyVoice2, OpenVoice, StyleTTS2, or Tortoise instead.

Ingen GPU trengs. MeloTTS kjører komfortabelt på CPU med omtrent 500 MB minne og er fortsatt i sanntid. En GPU er valgfri og gir bare ekstra fart. Omkring 500MB VRAM er nok hvis du velger å bruke en.

MeloTTS er en motor på TextToSpeechAI som bruker standard nivå, fakturert med 10 kreditter pr. 1000 tegn. Det er det laveste prisnivået, som passer med andre lettvekts CPU- modeller som Piper, VITS og Kokoro.

Både MeloTTS og Kokoro er raske, MIT/ Apache- lisenserte CPU- modeller på standard kredittnivå. Velg MeloTTS når du trenger forskjellige engelske aksenter (amerikansk, britisk, indisk, australsk). Velg Kokoro for sin brede flerspråklige stemmevariant. Begge er enkle å A/ B- test på TextToSpeechAI.

MeloTTS excelerer med aksent- variasjon og flerspråklig dekning, mens Piper tilbyr det største lydbiblioteket som er satt opp på forhånd. Både hurtig og CPU- med mulighet på standardnivå, så velg MeloTTS for aksentspesifikke prosjekter, og Piper når du vil ha det bredeste utvalg av distinkte stemmer.

Ja. Nye TextToSpeechAI kontoer inneholder gratis startpoeng, og det er en demo du kan bruke uten å melde deg inn. Det er nok til å teste MeloTTS- aksenter og stemmer før du kjøper ekstra kreditter eller abonnerer.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 6
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try MeloTTS Now

Generate your first audio free. No credit card required.

Start Free