Zonos
UltraClonagem vocal expressiva com controle de emoção e estilo
Sobre Zonos
Zonos de Zyphra é um modelo de texto a voz de 1.6B com avanço emotivo e controle de estilo. Apoia a clonagem de voz de 5-30 segundos de áudio de referência e pode modular o tom emocional da fala gerada. Escolha entre emoções como felicidade, tristeza, raiva, medo, surpresa e disgusto para criar áudio altamente expressivo e emocionalmente nuanced.
Características-chave
Controlo de emoção
Controle emoções de fala: felicidade, tristeza, raiva, medo, surpresa, desgosto e neutro.
Clonagem Voz
Clone qualquer voz de 5-30 segundos de áudio de referência com alta fidelidade.
Discurso expressivo
Os parâmetros 1.6B produzem fala altamente expressiva com entrega emocional nuanced.
Multilingual
Apoia inglês, japonês, chinês, francês e alemão.
Casos de utilização
Como Utilizar Zonos
-
1
Inscreva-se ou abra a demo
Crie uma conta TextToSpeechAI gratuita para obter créditos de início, ou use a demo de não sinalização para experimentar o Zonos imediatamente.
-
2
Escolha o motor Zonos
Selecione Zonos da voz e modelo de piquedor. Para clonar uma voz, carregue 5-30 segundos de áudio de referência limpa para que Zonos possa corresponder ao alto-falante.
-
3
Insira o seu texto
Digite ou cole o script que você quer falado. Zonos trabalha em inglês, japonês, chinês, francês e alemão.
-
4
Escolha uma emoção e gerar
Escolha uma das sete emoções do Zonos - neutra, felicidade, tristeza, raiva, medo, surpresa ou desgosto - e então clique em gerar para tornar discurso expressivo nesse humor.
-
5
Baixe ou use a API
Reproduzir e baixar o áudio acabado, ou ligar o mesmo motor Zonos programáticamente através da API TextToSpeechAI REST para fluxos de trabalho automatizados.
Zonos API
Gerar a fala programática usando a API TextToSpeechAI REST.
curl -X POST "https://api.texttospeechai.com/v1/generate/" \
-H "Authorization: Bearer YOUR_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"text": "Zonos gera discurso incrivelmente expressivo com controle emotivo finamente enraizado.",
"voice": "en_US-lessac-medium"
}'
Perguntas Frequentes
Technical Specs
- Generation Speed Medium
- Output Quality Excellent
- Voice Cloning Supported
- Languages 5
- GPU VRAM 8GB+
- Credits/1000 chars 50