TTS túi xáchName

Standard

Kiểu giọng nói cực nhẹ chạy thời gian thực trên CPU

Very Fast Tốc độ
Good Chất lượng
Có chứ. Bản sao
2 Ngôn ngữ

Về TTS túi xáchName

Windows 10, 8.1, 8, 7, Vista, XP, 2000, 2003, 2008, 2010, 2013, 2016, 2019, 2020, 2021, 2022, 2023, 2024, 2025,

Tính năng chính

Nhẹ siêu

100M parameters - chạy thời gian thực trên CPU với tài nguyên tối thiểu.

Ký âm

Sao chép bất kỳ giọng nói nào chỉ từ 5 giây âm thanh tham chiếu, ngay cả trên CPU.

Thời gian thực trên CPU

Không cần GPU. Tạo lời nói với tốc độ thời gian thực trên phần cứng tiêu chuẩn.

Sẵn sàng

Cũng có thể dùng cho Raspberry Pi, Raspberry Pi 2, và các thiết bị khác.

Tình huống sử dụng

Thiết lập Edge và di động Trợ lý giọng nói thời gian thực trên CPU IoT và thiết bị nhúng Bản sao giọng nói ít tài nguyên

Cách sử dụng TTS túi xáchName

  1. 1

    Đăng ký miễn phí hoặc thử bản demo

    Tạo một tài khoản TextToSpeechAI miễn phí để nhận tiền thưởng khởi đầu, hoặc sử dụng bản demo trên trang để nghe Pocket TTS trước khi đăng ký. Không cần GPU hay cài đặt địa phương.

  2. 2

    Chọn Pocket TTS và thêm giọng nói để sao chép

    Chọn Pocket TTS làm động cơ, sau đó tải lên một đoạn ghi chú ngắn khoảng 5 đến 10 giây để nhân bản giọng nói đó. Pocket TTS chạy hoàn toàn trên CPU, vì vậy nhân bản nhanh và nhẹ.

  3. 3

    Nhập văn bản

    Nhập hoặc dán văn bản tiếng Anh hoặc tiếng Pháp bạn muốn nói. Hãy chú ý đến số ký tự, vì Pocket TTS tính theo tỷ lệ chuẩn là 10 tín dụng cho mỗi 1000 ký tự.

  4. 4

    Tạo âm thanh

    Click generate và Pocket TTS tổng hợp văn bản của bạn thành giọng nói nhân bản với tốc độ thực. Hầu hết các đoạn phim sẽ sẵn sàng trong vài giây vì mô hình nhỏ và tiết kiệm CPU.

  5. 5

    Tải xuống hoặc sử dụng API

    Tải về âm thanh hoàn thành, hoặc tự động tạo thông qua API REST TextToSpeechAI tại api.texttospeechai.com bằng cách sử dụng token tài khoản của bạn. API này cho phép bạn tạo ra và tổng hợp Pocket TTS giống như ứng dụng của mình.

TTS túi xáchName API

Tạo lời nói bằng cách lập trình sử dụng TextToSpeechAI REST API.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Pocket TTS cung cấp sao chép giọng nói chạy trong thời gian thực, ngay cả trên CPU.",
    "voice": "en_US-lessac-medium"
  }'

Câu hỏi thường gặp

Pocket TTS là một mô hình chuyển văn bản sang nói cực nhẹ từ Kyutai với chỉ 100 triệu tham số. Nó chạy trong thời gian thực trên CPU và hỗ trợ nhân bản giọng nói từ 5 giây âm thanh.

Pocket TTS được cấp phép theo CC-BY-4.0, cho phép sử dụng thương mại với quyền sở hữu. Bạn phải ghi danh Kyutai khi sử dụng nó trong các ứng dụng thương mại.

Hiện tại Pocket TTS hỗ trợ tiếng Anh và tiếng Pháp. Có thể thêm nhiều ngôn ngữ trong các phiên bản sau.

Vâng! Chỉ với 100M tham số, Pocket TTS chạy với tốc độ thời gian thực trên phần cứng CPU tiêu chuẩn. Không cần GPU, làm cho nó lý tưởng cho việc triển khai rìa và ứng dụng di động.

Cả hai đều nhẹ và chạy tốt trên CPU. Pocket TTS hỗ trợ độc nhất vô nhị sao chép giọng nói (Kokoro không). Kokoro hỗ trợ nhiều ngôn ngữ hơn (9 so với 2). Chọn Pocket TTS nếu bạn cần sao chép giọng nói nhẹ, Kokoro nếu bạn cần nhiều ngôn ngữ hơn.

Cho 5 giây âm thanh tham chiếu. Pocket TTS trích xuất đặc điểm của người nói và có thể tạo ra lời nói mới trong giọng nói đó. Chất lượng được cải thiện với các tham chiếu dài hơn (đến 10 giây).

Có. Không giống như hầu hết các mô hình sao chép cần GPU, Pocket TTS thực hiện sao chép giọng nói không chụp hoàn toàn trên CPU nhờ vào dấu chân tham số 100M nhỏ bé của nó. Bạn có thể sao chép giọng nói từ một đoạn ngắn ngay cả trên laptop hay máy tính đơn bảng.

Pocket TTS được phát hành theo CC-BY-4.0, vì vậy bạn phải ghi nhận Kyutai là người tạo ra nó khi bạn sử dụng hoặc phân phối lại nó. Một sự ghi nhận đơn giản như "Giọng nói được tạo ra với Pocket TTS bởi Kyutai" thỏa mãn giấy phép cho cả việc sử dụng thương mại và không thương mại.

Pocket TTS tạo ra giọng nói trong thời gian thực hoặc nhanh hơn trên CPU tiêu chuẩn, không cần GPU. Điều này làm cho nó là một trong những động cơ phản ứng nhanh nhất cho các trường hợp sử dụng thời gian chậm như trợ lý giọng nói trực tiếp và tạo trên thiết bị.

Pocket TTS là một phần của mức giá tiêu chuẩn, với giá 10 credit cho mỗi 1000 ký tự, nó là một trong những tùy chọn sao chép giọng nói kinh tế nhất có sẵn trên TextToSpeechAI.

Cả hai đều là máy nhẹ, thân thiện CPU, cấp chuẩn. Chọn Pocket TTS khi bạn cần sao chép giọng nói, vì Kokoro không hỗ trợ nó. Chọn Kokoro khi bạn cần bao phủ ngôn ngữ rộng hơn và không cần sao chép giọng nói cụ thể.

Có. TextToSpeechAI tài khoản mới nhận được tiền khởi động miễn phí, và bản demo trên trang cho phép bạn nghe Pocket TTS trước khi ký kết. Đăng ký miễn phí, tải lên một đoạn phim tham khảo ngắn, và tạo ra lời nói nhân bản trong vài giây.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Supported
  • Languages 2
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try TTS túi xáchName Now

Generate your first audio free. No credit card required.

Start Free