MeloTTS

Standard

TTS đa giọng nhanh với giọng tự nhiên

Very Fast Tốc độ
Good Chất lượng
Không Bản sao
6 Ngôn ngữ

Về MeloTTS

[Translation temporarily unavailable. Please try again.]

Tính năng chính

Đa- giọng

Nhiều giọng tiếng Anh: Mỹ, Anh, Ấn Độ, và Úc.

CPU thời gian thực

Đủ nhanh để tổng hợp thời gian thực trên CPU mà không có GPU.

Ngôn ngữ

Hỗ trợ tiếng Anh, Tây Ban Nha, Pháp, Trung Quốc, Nhật Bản và Hàn Quốc.

Điều khiển tốc độ

Tốc độ nói có thể điều chỉnh cho kết quả được điều chỉnh.

Tình huống sử dụng

Các ứng dụng giọng nói đa giọng Bản địa phương hóa nội dung quốc tế Trợ lý giọng nói thời gian thực Sản xuất sách âm thanh với nhiều giọng nói

Cách sử dụng MeloTTS

  1. 1

    Đăng ký miễn phí hoặc thử bản demo

    Tạo một tài khoản TextToSpeechAI miễn phí để nhận tiền thưởng khởi động, hoặc sử dụng bản thử nghiệm không đăng ký trên trang chủ để thử MeloTTS ngay lập tức. Tiền thưởng miễn phí đủ để đánh giá một số giọng MeloTTS trước khi bạn thực hiện.

  2. 2

    Chọn giọng và giọng điệu MeloTTS

    Mở trình duyệt giọng nói và lọc vào MeloTTS. Chọn giọng nói phù hợp với người nghe, như tiếng Anh Mỹ, Anh, Ấn Độ, hay Úc, hay giọng nói bản địa Tây Ban Nha, Pháp, Trung Quốc, Nhật, hay Triều Tiên.

  3. 3

    Nhập văn bản

    Nhập hoặc dán văn bản bạn muốn nói vào hộp văn bản. MeloTTS tự động xử lý giọng nói tự nhiên, và bạn có thể điều chỉnh tốc độ nói để điều chỉnh nhịp điệu cho giọng nói bạn chọn.

  4. 4

    Tạo âm thanh

    Nhấn vào Create và MeloTTS tổng hợp lời nói của bạn trong thời gian thực. Bởi vì nó chạy hiệu quả trên CPU, kết quả trở lại nhanh ngay cả khi các đoạn dài hơn, và công việc này tốn 10 credits cho mỗi 1000 ký tự.

  5. 5

    Tải xuống hoặc sử dụng API

    Để tự động hóa MeloTTS trong ứng dụng của bạn, gọi API REST TextToSpeechAI tại api.texttospeechai.com bằng cách sử dụng token API của tài khoản của bạn.

MeloTTS API

Tạo lời nói bằng cách lập trình sử dụng TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "MeloTTS nói tự nhiên với giọng điệu thật từ khắp nơi trên thế giới.",
    "voice": "en_US-lessac-medium"
  }'

Câu hỏi thường gặp

MeloTTS là một mô hình chuyển văn bản sang nói nhanh từ MyShell AI chuyên về tổng hợp nói nhiều giọng. Nó hỗ trợ nhiều ngôn ngữ với nhiều biến thể giọng cho tiếng Anh, tạo ra giọng nói tự nhiên với tốc độ thời gian thực.

Có. MeloTTS được phát hành theo giấy phép MIT, bao gồm cả mã và trọng lượng mô hình. Bạn có thể dùng nó tự do trong các sản phẩm thương mại mà không cần phải trả tiền bản quyền hay yêu cầu ghi danh.

MeloTTS hỗ trợ giọng Anh Mỹ, Anh, Ấn Độ và Úc. Nó cũng bao gồm giọng nói bản địa cho tiếng Tây Ban Nha, Pháp, Trung Quốc, Nhật Bản và Hàn Quốc, khiến nó phù hợp với các ứng dụng quốc tế.

MeloTTS bao gồm sáu ngôn ngữ: tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp, tiếng Trung, tiếng Nhật và tiếng Hàn. Những giọng nói tiếng Anh thêm giọng khu vực thực sự trên ngôn ngữ cơ sở, vì vậy một mô hình duy nhất xử lý nhiều thị trường.

Có. MeloTTS được thiết kế cho tổng hợp thời gian thực và tạo giọng nói nhanh hơn so với chơi lại ngay cả trên CPU. Điều này làm cho nó phù hợp với trợ lý giọng nói trực tiếp, chatbots, và ứng dụng truyền tải.

MeloTTS tạo ra giọng nói tốt, âm thanh tự nhiên với giọng điệu rõ ràng và giọng điệu chính xác. Nó ưu tiên tốc độ và sự đa dạng giọng điệu hơn là độ chính xác cực cao của các mô hình chậm hơn như StyleTTS2 hay Tortoise, vì vậy nó là lý tưởng khi sự đáp ứng quan trọng nhất.

Không, MeloTTS không sao chép giọng nói. Nó sử dụng một tập hợp cố định của loa và giọng điệu đã định sẵn. Đối với sao chép giọng nói trên TextToSpeechAI, hãy dùng F5- TTS, Chatterbox, CosyVoice2, OpenVoice, StyleTTS2, hay Tortoise thay thế.

Không cần GPU. MeloTTS chạy thoải mái trên CPU sử dụng khoảng 500MB bộ nhớ và vẫn là thời gian thực. GPU là tùy chọn và chỉ tăng tốc độ; khoảng 500MB VRAM là đủ nếu bạn chọn sử dụng một.

MeloTTS là một động cơ cấp chuẩn trên TextToSpeechAI, tính phí là 10 credits cho 1000 ký tự. Đó là mức giá thấp nhất, tương đương với các mô hình CPU nhẹ khác như Piper, VITS, và Kokoro.

Cả MeloTTS và Kokoro đều là các mô hình CPU nhanh, được cấp phép MIT/ Apache ở cấp độ tín dụng tiêu chuẩn. Chọn MeloTTS khi bạn cần các giọng Anh khác nhau (Mỹ, Anh, Ấn Độ, Úc); chọn Kokoro vì nó có nhiều giọng nói đa ngôn ngữ. Cả hai đều dễ thử nghiệm A/ B trên TextToSpeechAI.

MeloTTS nổi bật với sự đa dạng giọng nói và bao phủ đa ngôn ngữ, trong khi Piper cung cấp thư viện giọng nói mặc định lớn nhất. Cả hai đều nhanh và có khả năng CPU ở cấp chuẩn, vì vậy chọn MeloTTS cho các dự án đặc biệt về giọng nói và Piper khi bạn muốn lựa chọn rộng nhất các giọng nói khác nhau.

Có. Các tài khoản mới TextToSpeechAI bao gồm tiền khởi động miễn phí, và có một bản thử nghiệm mà bạn có thể sử dụng mà không cần đăng ký. Điều đó đủ để thử nghiệm các giọng điệu và giọng nói MeloTTS trước khi mua thêm tiền hoặc đăng ký.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 6
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try MeloTTS Now

Generate your first audio free. No credit card required.

Start Free