โคโคโร

Standard

เร็วมาก เสียง TTS เบาๆ ด้วยคุณภาพธรรมชาติ

Very Fast ความเร็ว
Good คุณภาพ
ไม่มี กำลังสร้างคอลลิน
9 ภาษา

เกี่ยวกับ โคโคโร

[Translation temporarily unavailable. Please try again.]

ตัวเลือกหลัก

น้ำหนักเบามาก

พารามิเตอร์ 82M, ขนาดโมเดล ~300MB ทำงานบน CPU ด้วยทรัพยากรที่น้อยที่สุด

ใกล้เคียงเวลาจริง

สร้างเสียงพูดเร็วกว่าความเร็วในการเล่น แม้จะไม่มีการเร่งความเร็วของ GPU

ภาษาหลายภาษา

รองรับภาษาอังกฤษ ฝรั่งเศส สเปน ฮินดี ญี่ปุ่น จีน อิตาลี โปรตุเกส และเกาหลี

เสียงที่ผสมกัน

ผสมเสียงสองเสียงเข้าด้วยกัน เพื่อสร้างเสียงที่แตกต่างกัน

กรณีการใช้

เครื่องมือสนทนาแบบ real-time และผู้ช่วยเสมือน ข้อความสื่อสารผ่านสายเสียง การจัดวาง Edge และแอพพลิเคชันมือถือ ประมวลผลแบบแบตขนาดใหญ่

วิธีการใช้ โคโคโร

  1. 1

    ลงทะเบียนฟรี หรือลองดู Demo

    สร้างบัญชี TextToSpeechAI ฟรี เพื่อรับเครดิตเริ่มต้น 200 หรือใช้ demo ไม่ลงทะเบียน เพื่อฟัง Kokoro ทันที ระดับมาตรฐานหมายถึง Kokoro มีค่าใช้จ่ายเพียง 10 เครดิตต่อ 1000 ตัวอักษร

  2. 2

    เลือกเสียงของโคโคโร

    เปิดตัวเลือกเสียง และเลือกเสียง Kokoro ในภาษาที่คุณต้องการ (รองรับ9ภาษา ตั้งแต่ภาษาอังกฤษ ญี่ปุ่น และเกาหลี) คุณสามารถใช้การผสมเสียง Kokoro เพื่อผสมเสียงสองเสียงเข้าด้วยกันเป็นเสียงที่กำหนดเองได้

  3. 3

    พิมพ์ข้อความของคุณ

    พิมพ์หรือปะข้อความที่คุณต้องการให้พูดเข้าไปในตัวแก้ไข Kokoro สามารถจัดการข้อความยาวๆ ได้ดี ด้วยพารามิเตอร์ 82M ที่เบา และกลไกที่ใกล้เคียงกับเวลาจริง

  4. 4

    ปรับความเร็วและสร้าง

    ตั้งค่าความเร็วในการเล่นให้เหมาะสมกับกรณีการใช้ของคุณ แล้วคลิกที่ สร้าง Kokoro แสดงเสียงเร็วกว่าเวลาจริง ดังนั้น คำพูดของคุณจะพร้อมใช้งานได้ทันที

  5. 5

    ดาวน์โหลดหรือใช้ API

    ดาวน์โหลดเสียงที่เสร็จสมบูรณ์เป็น MP3 หรือ WAV หรืออัตโนมัติสร้างผ่าน TextToSpeechAI REST API ที่ api.texttospeechai.com สำหรับแบตและงานที่ต้องทำงานในเวลาจริง

โคโคโร ตัวช่วยการใช้งาน

สร้างเสียงพูดโดยใช้โปรแกรม โดยใช้ REST API TextToSpeechAI

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "โคโคโร พูดได้ตามธรรมชาติ ด้วยความเร็วและประสิทธิภาพที่น่าประหลาดใจ",
    "voice": "en_US-lessac-medium"
  }'

คำถามที่ถามบ่อย

Kokoro เป็นแบบจำลองการแปลงข้อความเป็นเสียงที่หนักน้อยมาก มีพารามิเตอร์เพียง 82 ล้านตัว แม้ว่าขนาดจะเล็ก แต่มันยังผลิตเสียงที่ฟังดูเป็นธรรมชาติ ผ่านหลายภาษา ด้วยความเร็วที่ใกล้เคียงกับเวลาจริง แม้แต่บน CPU

ใช่ Kokoro ได้รับการอนุมัติให้ใช้ Apache 2.0 อย่างเต็มที่ ทั้งโค้ดและโมเดล มันสามารถใช้ได้ฟรีในแอพพลิเคชันทางการค้าโดยไม่มีข้อจำกัด

Kokoro รองรับภาษาอังกฤษ (อเมริกันและอังกฤษ), ฝรั่งเศส, สเปน, ฮินดี, ญี่ปุ่น, จีน, อิตาลี, โปรตุเกส และเกาหลี

Kokoro เป็นหนึ่งในโมเดล TTS ที่เร็วที่สุดที่สามารถใช้ได้ มันสร้างเสียงได้เร็วกว่าการเล่นแบบเรียลไทม์ แม้แต่บน CPU ทำให้มันเหมาะสมกับแอพพลิเคชันแบบโต้ตอบ

ไม่ Kokoro ไม่ได้รองรับการทำซ้ำเสียง มันใช้ไลบรารีเสียงที่จัดเก็บไว้พร้อมกับความสามารถในการผสมเสียง สำหรับทำซ้ำเสียง ให้ใช้ F5- TTS, Chatterbox, StyleTTS2, OpenVoice หรือ Tortoise

Kokoro สามารถผสมเสียงสองเสียงเข้าด้วยกันเพื่อสร้างการรวมตัวที่ไม่เหมือนใคร นี่จะช่วยให้คุณสร้างคุณสมบัติเสียงที่กำหนดเองโดยไม่ต้องโคลนเสียงแบบดั้งเดิม

ทั้งสองรุ่นนี้เร็วและเบา Kokoro มีสถาปัตยกรรมที่ทันสมัยกว่า และรองรับการผสมเสียง ในขณะที่ Piper มีไลบรารีเสียงที่ใหญ่กว่า ทั้งสองรุ่นนี้เหมาะสำหรับแอพพลิเคชันแบบ real- time

Kokoro ถูกออกแบบมาเพื่อทำงานบน CPU และต้องการทรัพยากรอย่างน้อย - ประมาณ 300MB ไม่จำเป็นต้องใช้ GPU เลย แต่ก็รองรับการเร่งความเร็ว GPU เพื่อประมวลผลที่เร็วขึ้น

ใช่ Kokoro สร้างเสียงเร็วกว่าการเล่น แม้แต่บน CPU, ด้วยความล่าช้าที่ต่ำมาก ดังนั้นมันจึงเหมาะสมอย่างยิ่งสำหรับ chatbots, ผู้ช่วยเสียง, และสตรีมสด ขนาดพารามิเตอร์ 82M ทำให้การใช้งานหน่วยความจำเล็กลง ทำให้มันเป็นประโยชน์สำหรับการใช้ในปริมาณสูงและการจัดวางขอบ

การผสมเสียง ช่วยให้คุณสามารถผสมเสียง Kokoro สองเสียงเข้าด้วยกัน เพื่อสร้างการผสมที่ไม่เหมือนใครด้วยคุณสมบัติที่กำหนดเอง มันไม่ใช่การโคลนเสียงแบบดั้งเดิม - คุณไม่สามารถทำซ้ำคนที่กำหนดไว้จากตัวอย่าง - แต่มันให้คุณได้มากขึ้นกว่าไลบรารีเสียงที่กำหนดไว้ คุณสามารถทดลองกับการผสมเสียงโดยตรงในตัวแก้ไข TextToSpeechAI ได้

ทั้งสองตัวนี้เป็นเครื่องมือที่เร็วและใช้ CPU น้อย โดยไม่มีการจำลองเสียง Kokoro ใช้พื้นที่น้อยที่สุด (ประมาณ 300MB) และรองรับการผสมเสียงระหว่างภาษา9ภาษา ในขณะที่ MeloTTS เน้นการรวมเสียงภาษาอังกฤษและผลลัพธ์หลายภาษาแบบเรียลไทม์ เลือก Kokoro สำหรับพื้นที่ใช้น้อยที่สุดและการผสมเสียง เลือก MeloTTS เมื่อต้องการใช้เสียงที่มีความแตกต่างกัน

Kokoro is a standard-tier engine, costing 10 credits per 1000 characters - the lowest tier on TextToSpeechAI. New accounts get 200 free credits, so you can try Kokoro without paying. This makes it one of the most cost-effective ways to generate high-quality speech at scale.

Technical Specs

  • Generation Speed Very Fast
  • Output Quality Good
  • Voice Cloning Not Supported
  • Languages 9
  • GPU VRAM CPU OK
  • Credits/1000 chars 10

Try โคโคโร Now

Generate your first audio free. No credit card required.

Start Free