Nói- TTS

Premium

Tạo giọng nói mô tả văn bản

Moderate Tốc độ
Very Good Chất lượng
Không Bản sao
1 Ngôn ngữ

Về Nói- TTS

voices based on the text descriptions you provide. The voices are then used to generate the text-to-speech model. The voices are then used to generate the text-to-speech model. The voices are then used to generate the text-to-speech model. The text-to-speech model is used to generate the voices based on the text descriptions you provide. The voices are then used to generate the text-to-speech model

Tính năng chính

Mô tả văn bản

Tạo ra giọng nói bằng cách mô tả các đặc điểm mong muốn.

Điều khiển sáng tạo

Chỉ ra tuổi tác, giới tính, giọng nói, tốc độ và phong cách nói.

Giọng nói độc nhất

Tạo giọng nói không tồn tại trong thư viện đã được tạo sẵn.

Xuất tự nhiên

Tạo ra chất lượng cao, nói chuyện nghe tự nhiên.

Hiệu quả

Thuyết phục nhanh cho sự sinh ra giọng nói mô tả.

Mã nguồn mở

Apache 2.0 được cấp phép cho sử dụng thương mại.

Tình huống sử dụng

Thiết kế giọng nói nhân vật Dự án sáng tạo Nguyên mẫu lồng tiếng Phát triển trò chơi Ký tự sách âm thanh Tạo giọng nói tùy chỉnh

Nói- TTS Voices

View All 10
American Female
EN
American Male
EN
British Female
EN
British Male
EN
Calm Voice
EN
Cheerful Voice
EN
Conversational Voice
EN
Female Narrator
EN
Male Narrator
EN
Professional Voice
EN

Cách sử dụng Nói- TTS

  1. 1

    Đăng ký miễn phí hoặc thử bản demo

    Tạo một tài khoản TextToSpeechAI miễn phí cho 200 tín dụng khởi động, hoặc mở demo để thử Parler-TTS ngay lập tức mà không cần đăng ký.

  2. 2

    Chọn Parler-TTS và viết mô tả giọng nói

    Chọn Parler-TTS như là động cơ của bạn, sau đó viết một mô tả giọng nói văn bản đơn giản như "Một phụ nữ trẻ nói rõ ràng với giọng Mỹ." Cùng với tuổi, giới tính, giọng nói, tốc độ và tâm trạng để hình thành giọng nói.

  3. 3

    Nhập văn bản để nói

    Nhập hoặc dán văn lệnh bạn muốn nói. Parler- TTS sẽ hiển thị văn bản này bằng giọng nói được xác định bởi mô tả của bạn, vì vậy hãy giữ mô tả và văn lệnh bằng cùng một ngôn ngữ (tiếng Anh hoạt động tốt nhất).

  4. 4

    Tạo lời nói

    Click generate to send the job to our GPU backend. Parler-TTS synthesizes natural-sound audio matching your described voice, charged at the Premium level of 25 credits per 1000 characters.

  5. 5

    Tải xuống hoặc gọi API

    Tải về âm thanh hoàn thành như MP3, WAV, hoặc OGG, hoặc tự động tạo thông qua API TextToSpeechAI bằng cách truyền văn bản và mô tả giọng nói được lưu trữ trong mỗi yêu cầu.

Nói- TTS API

Tạo lời nói bằng cách lập trình sử dụng TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Một cô gái trẻ vui vẻ nói với giọng Mỹ.",
    "voice": "parler-female_american"
  }'

Câu hỏi thường gặp

Parler- TTS là một mô hình chuyển văn bản sang nói tạo ra giọng nói từ mô tả văn bản. Thay vì chọn giọng nói đã được tạo sẵn, bạn mô tả điều bạn muốn: "Một phụ nữ bình tĩnh, trưởng thành với giọng Úc nói với tốc độ trung bình."

Parler-TTS là mã nguồn mở theo giấy phép Apache 2.0. Trên TextToSpeechAI, chúng tôi tính 25 credit cho mỗi 1000 ký tự (tầng Premium) cho khả năng tạo giọng nói độc đáo của nó.

Parler- TTS chủ yếu hỗ trợ tiếng Anh. Mô tả giọng nói hoạt động tốt nhất trong tiếng Anh, mặc dù mô hình có thể xử lý nhiều giọng Anh khác nhau (Mỹ, Anh, Úc, v.v.).

Mô tả các đặc điểm giọng nói một cách tự nhiên: "Một phụ nữ trẻ nói rõ ràng với giọng Anh" hoặc "Một người đàn ông già với giọng nói sâu nói chậm và cẩn thận."

Parler-TTS có tốc độ tạo trung bình, thường là 2-5 giây mỗi câu trên GPU. Quá trình mô tả giọng nói thêm tối thiểu chi phí phụ so với việc tạo giọng nói thực tế.

Không, Parler- TTS tạo giọng nói từ mô tả thay vì sao chép giọng nói hiện có. Để sao chép giọng nói, hãy dùng StyleTTS2, F5- TTS, OpenVoice, hoặc Tortoise.

Parler-TTS yêu cầu 4-8GB VRAM tùy thuộc vào kích thước của mô hình. Phiên bản mini hoạt động với 4GB, trong khi mô hình đầy đủ được hưởng lợi từ 8GB cho hiệu suất tối ưu.

Có, Parler- TTS được cấp phép Apache 2. 0 và hỗ trợ sử dụng thương mại. Vì giọng nói được tạo ra từ mô tả, không có vấn đề sở hữu giọng nói.

Để bao gồm mô tả giọng nói của bạn trong yêu cầu API cùng với văn bản của bạn. API của chúng tôi xử lý mô tả và tạo ra giọng nói tương ứng. Bạn có thể lưu mô tả yêu thích để sử dụng lại.

Parler- TTS tạo ra âm thanh rất tốt, âm thanh tự nhiên với giọng nói tương ứng với giọng nói của bạn. Nó xuất ra WAV bản địa, và trên TextToSpeechAI bạn có thể tải nó về dạng MP3, WAV, hoặc OGG với chuyển đổi tự động.

Cả hai đều là những máy mã nguồn mở, nhưng chúng khác nhau về cách điều khiển. Parler- TTS cho phép bạn điều khiển giọng nói bằng một mô tả văn bản đơn giản (tuổi, giọng điệu, tốc độ, tâm trạng), trong khi Bark thêm các dấu hiệu không nói như [cười] và nhạc. Chọn Parler- TTS khi bạn muốn một giọng nói mô tả cụ thể và Bark khi bạn muốn truyền cảm xúc tự nhiên.

Đúng. Đăng ký một tài khoản miễn phí trên TextToSpeechAI để nhận 200 điểm khởi đầu, hoặc sử dụng bản thử nghiệm để nghe Parler-TTS mà không cần tài khoản. Điều đó đủ để thử nghiệm một số mô tả giọng nói trước khi chọn gói điểm.

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Not Supported
  • Languages 1
  • GPU VRAM 4-8GB
  • Credits/1000 chars 25

Try Nói- TTS Now

Generate your first audio free. No credit card required.

Start Free