Kokoro
StandardLynhurtig, lettvekts TTS med naturlig kvalitet
Om Kokoro
Kokoro er en 82M- parameter TTS- modell med ultravekt, som gir en utrolig tale med naturlig lyd. Den kjører nær sanntid selv på CPU, noe som gjør den ideell for programmer der lav latenstid er kritisk. Kokoro støtter flere språk og tilbyr stemmeblanding.
Nøkkelfunksjoner
Ultravekt
82M parametre, størrelse på ~300MB modell. Kjører på CPU med minimale ressurser.
Nær sanntid
Genererer tale raskere enn avspillingshastigheten, selv uten GPU- akselerasjon.
Flerspråks
Støtter engelsk, fransk, spansk, hindi, japansk, kinesisk, italiensk, portugisisk og koreansk.
Stemmeblanding
Bland to stemmer sammen for å skape unike stemmekombinasjoner.
Brukstilfeller
Bruksmåte Kokoro
-
1
Registrer deg gratis eller prøv demoen
Lag en ledig TextToSpeechAI- konto for å få 200 startpoeng, eller bruk demoen uten designering til å høre Kokoro umiddelbart. Standardnivået betyr at Kokoro bare koster 10 poeng per 1000 tegn.
-
2
Velg en Kokoro- stemme
Åpner taleleseren og velger en Kokoro- stemme på målspråket ditt (9 støttes, fra engelsk til japansk og koreansk). Du kan også bruke Kokoro- stemmeblanding for å blande to stemmer med en selvvalgt kombinasjon.
-
3
Skriv inn teksten
Skriv inn eller lim inn teksten du vil ha snakket inn i redigeringen. Kokoro håndterer lange passasjer effektivt takket være sin lette 82M- parameter nær sanntidsmotoren.
-
4
Juster hastighet og generering
Sett avspillingshastigheten slik at den passer til store og små bokstaver, trykk så Generer. Kokoro viser en lyd raskere enn sanntid, så tale- en din er klar nesten med en gang.
-
5
Last ned eller bruk API
Last ned den ferdige lyden som MP3 eller WAV, eller automatiser generering gjennom TextToSpeechAI REST API på api.texttospeechai.com for masse- og sanntids arbeidsbelastning.
Kokoro API
Generer taleprogrammatisk ved å bruke TextToSpeechAI REST API.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Kokoro leverer naturlig tale med utrolig hastighet og effektivitet.",
"voice": "en_US-lessac-medium"
}'
Ofte stilte spørsmål
Technical Specs
- Generation Speed Very Fast
- Output Quality Good
- Voice Cloning Not Supported
- Languages 9
- GPU VRAM CPU OK
- Credits/1000 chars 10