เสียงเปิดName

Ultra

สร้างเสียงแบบคล้ายกันโดยใช้การควบคุมระดับเสียงแบบก้อน

Moderate ความเร็ว
Very Good คุณภาพ
ใช่ กำลังสร้างคอลลิน
10 ภาษา

เกี่ยวกับ เสียงเปิดName

of the voice and apply it to the speaking style. OpenVoice is an instant voice clone model that allows fine-grained control over speaking style, allowing you to takealook at the voice and apply it to the speaking style. OpenVoice is an instant voice clone model that allows fine-grained control over speaking style, allowing you to takealook at the

ตัวเลือกหลัก

สร้างคอลลินส์ทันที

โคลนเสียงใดๆ จากเสียงเพียงไม่กี่วินาที

ควบคุมระดับเสียง

ใช้เสียงที่มีความสุข เศร้า โกรธ ตื่นเต้น หรือกระซิบบอก

เปลี่ยนรูปแบบ

แยกเสียงออกจากสไตล์การพูด เพื่อความยืดหยุ่น

ภาษาต่างๆKCharselect unicode block name

ใช้เสียงที่ถูกโคลน ผ่านภาษาต่างๆ

ประมวลผลเร็ว

ประมวลผลเสียงอย่างรวดเร็ว

โอเพนซอร์ส

MIT อนุมัติให้ใช้ในเชิงพาณิชย์

กรณีการใช้

เนื้อหาที่แสดงอารมณ์ การเคลื่อนไหวของตัวอักษร เกมแบบแสดงผล คำบรรยายของหนังสือเสียง วิดีโอการตลาด เครื่องมือช่วยเหลือเสมือนName

วิธีการใช้ เสียงเปิดName

  1. 1

    ลงทะเบียนฟรี หรือลองดู Demo

    สร้างบัญชี TextToSpeechAI ฟรี เพื่อรับเครดิตเริ่มต้น หรือใช้หน้า Demo เพื่อฟัง OpenVoice ก่อนที่จะทำการคอมมิชชั่น ไม่ต้องใช้ GPU หรือติดตั้ง - ทุกอย่างทำงานบนเซิร์ฟเวอร์ของเรา

  2. 2

    เลือก OpenVoice และโหลดคลิปที่ใช้อ้างอิง

    เลือกเครื่องมือ OpenVoice แล้วโหลดเสียงที่ใช้เป็นข้อมูลอ้างอิงไว้ไม่กี่วินาที เพื่อโคลนเสียงเป้าหมาย OpenVoice จะจับภาพตัวตนของผู้พูด เพื่อให้คุณสามารถใช้มันได้อีกครั้งในข้อความและเสียงใดๆ

  3. 3

    พิมพ์ข้อความของคุณ

    พิมพ์หรือปักหมุดสคริปต์ที่คุณต้องการให้พูดในเสียงที่ถูกคลุมเครือ OpenVoice รองรับภาษาประมาณ 10 ภาษา และส่งเสียงผ่านภาษาต่าง ๆ ดังนั้น คุณสามารถเขียนภาษาที่แตกต่างจากคลิปที่อ้างถึงได้

  4. 4

    เลือกสไตล์เสียงและสร้าง

    เลือกหนึ่งใน9รูปแบบเสียง OpenVoice - ตัวกำหนดเอง, มิตร, สุขใจ, ตื่นเต้น, เศร้า, โกรธ, กลัว, ตะโกน, หรือกระซิบกระซาบ - แล้วสร้างเสียง เสียงที่โคลนเดียวกันจะพูดด้วยการส่งมอบอารมณ์

  5. 5

    ดาวน์โหลดหรือใช้ API

    ดาวน์โหลดเสียงของคุณเป็น MP3, WAV, หรือ OGG หรืออัตโนมัติสร้างผ่าน API TextToSpeechAI โดยส่งเสียงและสไตล์เสียงที่โคลนของคุณในแต่ละคำขอ

เสียงเปิดName ตัวช่วยการใช้งาน

สร้างเสียงพูดโดยใช้โปรแกรม โดยใช้ REST API TextToSpeechAI

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "OpenVoice สามารถพูดได้ทุกเสียง มีความสุข เศร้า หรือกระซิบบอก",
    "voice": "en_US-lessac-medium"
  }'

คำถามที่ถามบ่อย

OpenVoice เป็นโมเดลการแปลงข้อความเป็นเสียงและโคลนเสียงที่มีความก้าวหน้า ซึ่งแยกตัวตนของเสียงออกจากสไตล์การพูด มันจะช่วยให้คุณโคลนเสียงและใช้เสียงอารมณ์ที่แตกต่างกัน โดยไม่ต้องใช้เสียงอ้างอิงใหม่สำหรับอารมณ์แต่ละอารมณ์ มันถูกสร้างขึ้นเพื่อการแสดงออกและการควบคุมการสร้างเสียง

ใช่ OpenVoice จะทำการโคลนเสียงในทันที จากเสียงที่อ้างอิงเพียงไม่กี่วินาที - ไม่จำเป็นต้องฝึกซ้อม หลังจากที่เสียงถูกจับได้ OpenVoice จะสามารถใช้ตัวตนนั้นได้อีกครั้ง บนข้อความและสไตล์เสียงที่คุณเลือก

OpenVoice ใช้โครงสร้างสองระดับ ซึ่งแยกการสังเคราะห์เสียงพื้นฐานออกจากการแปลงเสียง หลังจากโคลนเสียงแล้ว คุณสามารถใช้สไตล์เสียงได้9แบบ - แบบปริยาย, มิตรภาพ, สุขภาพดี, ตื่นเต้น, เศร้า, โกรธ, กลัว, ตะโกน หรือกระซิบกระซาบ - และเสียงที่โคลนมาจะพูดแตกต่างกันไปตามเสียงที่คุณเลือก โดยไม่ต้องบันทึกใหม่

OpenVoice รองรับการพูด9รูปแบบ: แบบปริยาย, มิตรภาพ, สุขภาพดี, ตื่นเต้น, เศร้า, โกรธ, กลัว, ตะโกน และกระซิบกระซาบ รูปแบบแต่ละแบบจะปรับแต่งการส่งอารมณ์ในขณะที่ยังคงรักษาตัวตนของผู้พูดที่ถูกโคลนไว้ ให้คุณควบคุมการอ่านบรรทัดได้ดีขึ้น

OpenVoice เป็นโอเพนซอร์สภายใต้ใบอนุญาต MIT ดังนั้น มันจึงฟรีสำหรับการใช้ในเชิงพาณิชย์ เช่นเดียวกับโมเดลการโคลนอื่น ๆ โปรดแน่ใจว่าคุณมีสิทธิ์ที่เหมาะสมกับเสียงใด ๆ ที่คุณโคลนเพื่อโครงการเชิงพาณิชย์

OpenVoice รองรับภาษาประมาณ 10 ภาษา รวมถึงภาษาอังกฤษ, ภาษาจีน, ภาษาญี่ปุ่น, ภาษาเกาหลี และภาษายุโรปหลายภาษา มันยังมีบริการโคลนภาษาต่างๆ ด้วย ดังนั้นคุณสามารถโคลนเสียงในภาษาหนึ่ง และให้มันพูดตามธรรมชาติในภาษาอื่น

OpenVoice มีความเร็วในการสร้างเสียงที่พอเหมาะ ปกติแล้วจะแสดงประโยคในเวลา 2-4วินาทีบน GPU คุณภาพของผลลัพธ์นั้นดีมาก ด้วยการแสดงเสียงที่ชัดเจน และการส่งสัญญาณเสียงที่รักษาตัวตนของผู้พูดไว้โดยไม่เปลี่ยนแปลง ขณะที่เปลี่ยนการแสดงอารมณ์อย่างน่าเชื่อถือ

OpenVoice ใช้ VRAM ประมาณ 6- 8GB ขึ้นอยู่กับขนาดของการแปลงและค่าใช้จ่ายในการแปลงเสียง มันทำงานได้ดีบน GPU ระดับกลางและระดับสูง และบน TextToSpeechAI ทั้งหมดนี้จะถูกจัดการบนเซิร์ฟเวอร์ของเรา ดังนั้นคุณจึงไม่ต้องการฮาร์ดแวร์ในท้องถิ่น

OpenVoice เป็นเครื่องมืออัลตรา- ทีร์ ราคา 50 เครดิตต่อตัวอักษร 1000 ตัว อัลตรา- ทีร์ แสดงให้เห็นการควบคุมเสียงที่ทันสมัย และความสามารถในการคำนวณที่เพิ่มเข้ามา สำหรับการคลอนแคลน รวมถึงการแปลงสไตล์

OpenVoice มีคุณสมบัติเฉพาะตัวในการควบคุมเสียงและสไตล์เสียง: คุณสามารถเลือกเสียงที่ถูกโคลนมาและส่งเสียงกลับมาเป็นเสียงที่มีความสุข, เศร้า, โกรธ หรือกระซิบกระซาบ F5- TTS เร็วกว่า และเป็นกลไกการโคลนเสียงปริยายของเราสำหรับเสียงที่พูดได้ตามธรรมชาติ เลือก OpenVoice เมื่อคุณต้องการควบคุมสไตล์อารมณ์ และ F5- TTS เมื่อคุณต้องการโคลนเสียงตามธรรมชาติอย่างรวดเร็วที่สุด

สร้างเสียงที่คล้ายกันโดยการโหลดข้อมูลเสียงที่ใช้อ้างอิงมาแล้วกำหนดรูปแบบเสียงในคำร้องขอ API ของท่าน API จะใช้เสียงอารมณ์ที่คุณเลือกไว้กับเสียงที่คล้ายกันโดยอัตโนมัติ และส่งเสียงกลับมาในรูปแบบ MP3, WAV หรือ OGG

ใช่ โปรดลงทะเบียนบัญชี TextToSpeechAI ฟรี เพื่อรับเครดิตเริ่มต้น และลองใช้ OpenVoice ในการคลาวด์และควบคุมเสียง หรือใช้ตัวอย่างบนหน้าก่อน ไม่มีการตั้งค่าภายใน - โหลดคลิปที่ใช้อ้างอิง, เลือกเสียง และสร้างในเบราว์เซอร์

Technical Specs

  • Generation Speed Moderate
  • Output Quality Very Good
  • Voice Cloning Supported
  • Languages 10
  • GPU VRAM 3-6GB
  • Credits/1000 chars 50

Try เสียงเปิดName Now

Generate your first audio free. No credit card required.

Start Free