நாள்

Ultra

குரல் ஒத்த மற்றும் வார்த்தை இல்லாத ஒலிகளுடன் உரையாடல்- மைய TTS

Medium வேகம்
Excellent தரம்
ஆம் மாதிரியாக்கம்
1 மொழிகள்

& பற்றி நாள்

ing the ability to generate dialogues from 1000-1500 words, and is capable of generating 1000-2000 words per second. Dia is the first text-to-speech model to use the 1.6B parameter, and is the first text-to-speech model to use the 1.6B parameter. Dia is the first text-to-speech model to use the 1.6B parameter,

முக்கியமான அம்சங்கள்

உரையாடல் உருவாக்கம்

இயற்கையான பல-பேச்சாளர் உரையாடல்களை தனிப்பட்ட குரல்களுடன் மற்றும் சுழற்சி-எடுப்புடன் உருவாக்கவும்.

வார்த்தை இல்லாத ஒலிகள்

இயற்கையான மொழிபெயர்ப்புக்கு [சிரிப்பு], [சிந்தனை], [காய்ச்சல்], (காய்ச்சல்) சேர்க்கவும்.

குரல் ஒத்தமைப்பு

தனிப்பட்ட உரையாடலுக்கு 5-10 விநாடிகள் தொடர்பு ஒலியில் இருந்து எந்த குரலையும் மாதிரியாக்குக.

இயற்கை உரையாடல்

1.6B அளவுருக்கள் மிகவும் இயற்கையான உரையாடல் புரொசோடி மற்றும் இட்டனசினை உருவாக்குகின்றன.

பயன்பாட்டு வழக்கங்கள்

உரையாடல் மற்றும் உரையாடல் உருவாக்கம் பல எழுத்துகளுடன் ஒலி புத்தக உற்பத்தி விளையாட்டுக் கதாபாத்திரங்களின் குரல்கள் பட்ஜெட் மற்றும் உள்ளடக்க உருவாக்கம்

பயன்படுத்துவது எப்படி நாள்

  1. 1

    இலவசமாக பதிவு செய்து கொள்ளவும் அல்லது திறக்கவும்

    உங்கள் துவக்கக் கடன்களைக் கோர ஒரு இலவச TextToSpeechAI கணக்கை உருவாக்கவும், அல்லது டையா உரையாடலை உடனடியாக முயற்சிக்க பதிவு செய்யாத டெமோவை திறக்கவும்.

  2. 2

    Dia இயந்திரத்தை தேர்ந்தெடு

    TTS டேஷ்போர்டில் இயந்திர பட்டியலிலிருந்து Dia ஐ தேர்ந்தெடு. Dia என்பது உரையாடல்- மையப்படுத்தப்பட்ட, அதிக- அடுக்கு மாதிரி, பல- ஒலியெழுப்பி மற்றும் குரல்- ஒத்த ஆதரவுடன்.

  3. 3

    அடையாளங்களுடன் உரையாடல் குறுநிரலை எழுதுக

    உங்கள் உரையாடலை [S1] மற்றும் [S2] பயன்படுத்தி எழுதுங்கள் ஒவ்வொரு பேச்சாளர் சுற்றும் குறிக்கவும், [சிரிப்பு], [சிந்தனை], [காய்ச்சல்], அல்லது (காய்ச்சல்) போன்ற வார்த்தை இல்லாத குறிகளை நீங்கள் இயற்கையான விளைவுகளை விரும்பும் இடத்தில் விடுங்கள்.

  4. 4

    ஒலியை உருவாக்கு

    உங்கள் Dia குறுநிரலை எங்கள் GPU களுக்கு அனுப்புவதற்கு உருவாக்குக என்பதை கிளிக் செய்யவும். Dia இரண்டு- ஒலியாளர் உரையாடலை மாற்று- எடுக்கும் மற்றும் உங்கள் வார்த்தை இல்லாத குறிகளை ஒரே ஒலி கோப்பாக மாற்றுகிறது.

  5. 5

    API யை பதிவிறக்கவும் அல்லது அழை

    முடிந்த உரையாடலை உங்கள் தேர்ந்தெடுத்த வடிவத்தில் பதிவிறக்கவும், அல்லது அதே [S1] / [S2] குறுநிரலை TextToSpeechAI API க்கு உங்கள் கணக்கு டாக்கின் மூலம் பதிவிறக்கவும்.

நாள் API

TextToSpeechAI REST API ஐப் பயன்படுத்தி மென்பொருள் மூலம் பேசி உருவாக்கவும்.

curl -X POST "https://api.texttospeechai.com/v1/generate/" \
  -H "Authorization: Bearer YOUR_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[S1] வணக்கம்! இன்று எப்படி இருக்கிறீர்கள்? [சிரித்தபடி] [S2] நான் நன்றாக இருக்கிறேன், கேட்டதற்கு நன்றி!",
    "voice": "en_US-lessac-medium"
  }'

அடிக்கடி கேட்கப்படும் கேள்விகள்

Dia என்பது Nari Labs இல் இருந்து 1. 6B அளவுரு உரையாடல்- மையப்படுத்தப்பட்ட உரை- இருந்து- பேச்சு மாதிரி. இது பல பேச்சாளர்களுக்கு ஆதரவுடன் இயற்கையான உரையாடல் பேச்சை உருவாக்குவதில் சிறப்பு, வார்த்தை இல்லாத ஒலிகள், மற்றும் குரல் ஒத்தமைப்பு.

ஆம், Dia முழுமையாக அப்பாச்சி 2.0உரிமம் பெற்றது - குறியாக்கம் மற்றும் மாதிரி எடைகள். இது வணிக பயன்பாடுகளில் இலவசமாக பயன்படுத்த முடியும்.

தற்போது Dia ஆங்கிலத்தை மட்டுமே ஆதரிக்கிறது. இயற்கையான ஆங்கில உரையாடல் பேசுவதற்கு இந்த மாதிரி சிறந்ததாக உள்ளது.

Dia க்கு 10GB VRAM தேவைப்படுகிறது அதன் 1.6B அளவுரு மாதிரிக்கு. குறைந்தது 12GB GPU வசதியான செயல்பாட்டிற்கு பரிந்துரைக்கப்படுகிறது. TextToSpeechAI இல் இது அனைத்தும் எங்கள் ஹோஸ்டிங் GPU களில் இயங்குகிறது, எனவே உங்களுக்கு உங்கள் சொந்த வன்பொருள் தேவையில்லை.

ஆமாம் - பேச்சு Dia உருவாக்கப்பட்டது. உங்கள் எழுத்துருவில் [S1] மற்றும் [S2] சுழற்சிகளை மாற்றி மாற்றி, Dia TTS ஒரு இரு- ஒலியாளர் உரையாடலை உருவாக்குகிறது, தனிப்பட்ட குரல்களுடன் மற்றும் உண்மையான சுழற்சி- எடுக்கும், இது ஒரு- ஒலியாளர் TTS மாதிரிகளுடன் எளிதாக அடைய முடியாதது.

உங்கள் எழுத்துருவில் ஒவ்வொரு வரிகளையும் [S1] அல்லது [S2] யுடன் முன்னொட்டு செய்யவும் பேசுபவர் யார் என்பதை குறிக்க. Dia ஒவ்வொன்றும் ஒரே மாதிரியான குரலை ஒதுக்குகிறது மற்றும் உரையாடல் நகர்வதை போல அவற்றை மாற்றுகிறது, எனவே [S1] மற்றும் [S2] உங்கள் உரையாடலில் இரண்டு எழுத்துக்களாக செயல்படுகின்றன.

ஆம். Dia 5- 10 விநாடிகள் சுத்தமான குறிப்பு ஒலியை குரல் ஒத்ததை ஆதரிக்கிறது, நீங்கள் ஒரு குறிப்பிட்ட குரலை ஒலிப்பதிவுக்காக மீண்டும் பயன்படுத்த அனுமதிக்கிறது. நீங்கள் [S1] / [S2] குறிகளுடன் ஒத்ததை இணைக்கலாம், எனவே உரையாடலில் ஒவ்வொரு எழுத்தும் நீங்கள் ஒத்த குரலை ஒலிக்கச் செய்கிறது.

Dia [சிரிப்பு], [சிந்தனை], [காய்ச்சல்], மற்றும் (காய்ச்சல்) ஆகியவற்றை இயற்கையான paralinguistic ஒலிகளாக மாற்றுகிறது, பேசப்பட்ட வார்த்தைகளை விட பேசப்பட்ட வார்த்தைகளை உருவாக்குகிறது. நீங்கள் எதிர்வினையை விரும்பும் இடத்தில் ஒரு குறியை வைக்கவும் - உதாரணமாக "[S1] அது சிரிப்பு [சிரிப்பு]" - உரையாடலை மனித உணர்வை ஏற்படுத்தும்.

Dia மற்றும் Bark இருவரும் வார்த்தை இல்லாத ஒலிகளை ஆதரிக்கின்றன, ஆனால் Dia [S1] / [S2] சுழற்சி மற்றும் குரல் ஒத்த பல- பேச்சாளர் உரையாடலுக்கு வடிவமைக்கப்பட்டுள்ளது. இரு- நபர் உரையாடல்களுக்கு Dia தேர்ந்தெடுக்கவும்; ஒற்றை குரல் உரையாடலில் நீங்கள் விரிவான மொழிக் கவர் தேவைப்பட்டால் Bark சிறந்த பொருத்தமாக இருக்கும்.

Dia ஒரு அல்ட்ரா- டிரைவ் இயந்திரம், எனவே இது 1,000 எழுத்துக்கள் உருவாக்கப்பட்ட பேச்சிற்கு 50 கிரெடிட் செலவாகும். அல்ட்ரா டிரைவ் பெரிய 1.6B மாதிரி மற்றும் ~10GB GPU நினைவகத்தை உயர்தர பேச்சுக்காக பயன்படுத்துகிறது.

ஆமாம். புதிய TextToSpeechAI கணக்குகள் இலவச ஆரம்ப கடன்களை உள்ளடக்கியுள்ளன, மற்றும் நீங்கள் பதிவு செய்யாமல் இயக்கக்கூடிய ஒரு டெமோ உள்ளது. அது ஒரு சிறிய Dia உரையாடலை உருவாக்க [S1] / [S2] குறிச்சொற்களுடன் ஒரு கட்டணம் செலுத்தும் திட்டம் குறித்து முடிவு செய்யும் முன் போதுமானது.

ஆம். உங்கள் கணக்கு பக்கத்தில் API டாக்கன் இருந்தால் நீங்கள் Dia உரையாடல் எழுத்துருக்களை அனுப்பலாம் - [S1] / [S2] சுழற்சிகள் மற்றும் [laughs] போன்ற குறிகள் உள்ளிட்ட - TextToSpeechAI REST API க்கு மற்றும் அதன் விளைவாக ஒலியை நிரல்முறையாக பதிவிறக்கலாம்.

Technical Specs

  • Generation Speed Medium
  • Output Quality Excellent
  • Voice Cloning Supported
  • Languages 1
  • GPU VRAM 10GB
  • Credits/1000 chars 50

Try நாள் Now

Generate your first audio free. No credit card required.

Start Free