VibeVoice

Speaker 3

இயல்பான ஆங்கிலம் Neutral VibeVoice

Speaker 3 என்பது VibeVoice உரை- இருந்து- பேச்சு மாதிரியினால் இயக்கப்படும் neutral AI குரல். இந்த நிலையான குரல் ஆங்கிலம் பேசுகிறது மற்றும் ஸ்டூடியோ- தரமான பேச்சு சேர்க்கையை வழங்குகிறது. நெருங்கிய-தடவை உருவாக்க வேகம் மற்றும் 5/5 தர மதிப்பீடுகளுடன், Speaker 3 podcasts, dialogues, long-form narration, multi-speaker content க்கு மிகவும் பொருத்தமானது. இவ்வகைப் பறவைகள் ஈரமான இடங்களில் வாழக்கூடியவை, இவை வசிக்கும் இடம் பாதுகாப்பானது. முக்கியமான திறன்கள்: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

மதிப்பீடுகள் இல்லை

VibeVoiceமாதிரி தகவல்

மாதிரி VibeVoice
உருவாக்குநர் Microsoft
தரம்
வேகம் தற்காலிக
உரிமம் MIT
மாதிரியாக்கம் கிடைக்கவில்லை
மிருகம் தரமான (2 புள்ளிகள்/ 1K எழுத்துக்கள்)
அளபுருக்கள் 1.5B
கட்டிடக்கலை LLM + DAC
பயிற்சி தரவு 100000 மணிகள்
ஆண்டு 2025

சிறந்த பயன்பாடுகள் Speaker 3

இந்த குரலின் குணங்களை அடிப்படையாகக் கொண்ட பரிந்துரைக்கப்பட்ட பயன்பாடுகள்

ஒலிப்புத்தகங்கள் & உரையாடல்Name

இயற்கையான வரிவடிவம் மற்றும் வெளிப்பாட்டின் மூலம் நீண்ட வடிவ உள்ளடக்கத்தை கூற Speaker 3 ஐ பயன்படுத்தவும்.

வீடியோ குரல் மேலாண்மை

யூடியூப் வீடியோக்களுக்கு, விளம்பரங்களுக்கும், சமூக ஊடக உள்ளடக்கங்களுக்கும் தொழில்முறை உரையாடலை சேர்க்கவும்.

பயன்பாடுகள் & அணுகல்

வேகமான உருவாக்கம் இந்த குரலை உண்மையான நேர பயன்பாடுகள், திரை வாசிப்பவர்கள் மற்றும் அணுகக்கூடிய கருவிகளுக்கு சிறந்ததாக ஆக்குகிறது.

பாட்டுக்களும் ஒலிபரப்பும்

ப்ளாக்ஸ்பாட், வானொலி மற்றும் தொழில்முறை ஒலிபரப்புக்கு ஏற்ற ஸ்டுடியோ தர வெளியீடு.

மேலும் VibeVoice குரல்கள்

அதே TTS மாதிரியில் உள்ள மற்ற குரல்கள்

Speaker 1

ஆங்கிலம் Neutral

Speaker 1 (Chinese)

சீன மொழி Neutral

Speaker 2

ஆங்கிலம் Neutral

Speaker 2 (Chinese)

சீன மொழி Neutral

Speaker 4

ஆங்கிலம் Neutral

அடிக்கடி கேட்கப்படும் கேள்விகள்

மைக்ரோசாப்ட் வின் வைப் வாசிப்பு இரண்டு வகைகளில் வருகிறது: நீண்ட-வடிவ உள்ளடக்கத்திற்கு 1.5B மாதிரி (90 நிமிடங்கள் வரை,4ஒலிப்பேச்சு) மற்றும் ~200ms முதல் ஒலி தாமதத்துடன் ஒலிப்பேச்சு ஒலிப்பதற்கு ஒரு ரியல்டைம் 0.5B மாதிரி. 1.5B வகை தொலைக்காட்சி நிகழ்ச்சிகள் மற்றும் ஒலிப்பேச்சு நூல்களில் சிறந்து விளங்குகிறது. குறிப்பு: மைக்ரோசாப்ட் TTS குறியீட்டை சேமிப்பகத்திலிருந்து நீக்கியது மற்றும் உருவாக்கப்பட்ட ஒலியில் கேட்கக்கூடிய AI நியாயப்படுத்தல்களும் உள்ளன.

பைபேவாயிஸ் மைக்ரோசாப்ட் நிறுவனத்தால் உருவாக்கப்பட்டது மற்றும் MIT (research-only intent) உரிமத்தின் கீழ் வெளியிடப்பட்டது, இது உருவாக்கப்பட்ட ஒலியை வணிக ரீதியாக பயன்படுத்த அனுமதிக்கிறது.

VibeVoice 1 மொழிக்கு ஆதரவு: English.

VibeVoice பிரீமியம் நிலையில் உள்ளது - 1,000 எழுத்துக்களுக்கு4கொடைகள். நீங்கள் எந்த VibeVoice குரலையும் முழு ஒலியை உருவாக்குவதற்கு முன்பு இலவசமாக முன்பார்வை செய்யலாம்.

VibeVoice க்கு நடுத்தரமான உருவாக்க வேகம் உள்ளது. உருவாக்கம் பொதுவாக உரை நீளத்தை பொறுத்து சில நொடிகள் எடுக்கும்.

TTS.ai இல் ஒலி தரத்திற்காக 5/5 மதிப்பெண் பெற்றுள்ளது. இது ஸ்டுடியோ தரமான, மனிதர் போல் பேசுவதை வழங்குகிறது.

இல்லை, VibeVoice ஒரு நிலையான உள்ளமைந்த குரல்களை பயன்படுத்துகிறது. குரல் ஒத்தமைப்பிற்கு, CosyVoice2, GPT-SoVITS, அல்லது Chatterbox போன்ற மாதிரிகளை முயற்சிக்கவும்.

ஆம், VibeVoice குறிப்பாக பட்ஜெட்கள், ஒலி புத்தகங்கள், நீண்ட வடிவ பல- ஒலிப்பதிவு உள்ளடக்கங்களுக்கு பரிந்துரைக்கப்படுகிறது. அதன் பல- ஒலிப்பதிவு, 90 நிமிடங்கள் வரை, பட்ஜெட் உருவாக்கும் திறன்கள் இதை ஒரு சிறந்த தேர்வாக மாற்றுகிறது.

ஆம், வியப்வொயிஸ் MIT (research-only intent) கீழ் அனுமதி பெற்றுள்ளது, இது வணிக பயன்பாட்டிற்கு அனுமதிக்கிறது. வியப்வொயிஸ் குரல்களுடன் உருவாக்கப்பட்ட ஒலியை வீடியோக்கள், பாட்டிக்ஸ், பயன்பாடுகள், விளையாட்டுகள் மற்றும் வேறு எந்த வணிக திட்டங்களிலும் பயன்படுத்தலாம்.

ஆம், TTS.aiல் உள்ள அனைத்து குரல்களும் வர்த்தக ரீதியாக அனுமதிக்கப்பட்ட திறந்த மூல மாதிரிகளை பயன்படுத்துகின்றன (MIT, Apache 2.0). உருவாக்கப்பட்ட ஒலியை வீடியோக்கள், ப்ளாட்ஃபார்ம்கள், பயன்பாடுகள், விளையாட்டுகள் மற்றும் வேறு எந்த வர்த்தக பயன்பாடுகளிலும் பயன்படுத்தலாம்.

/api/v1/tts/ க்கு ஒரு POST கோரிக்கையை அனுப்பவும். அதில் மாதிரி பெயர் மற்றும் குரல் அடையாளம் இருக்க வேண்டும். பைத்தான், ஜாவாஸ்கிரிப்ட், கோ மற்றும் cURL க்கான குறிமுறை உதாரணங்களுக்கு எங்கள் API ஆவணப் பக்கத்தைப் பாருங்கள்.

ஆம், இந்த பக்கத்தில் உள்ள இயக்க பொத்தானை க்ளிக் செய்து ஒரு மாதிரியை கேட்கலாம். உரை உரையாடல் பக்கத்தில் தனிப்பயன் உரையை நீங்கள் உள்ளிடலாம் மற்றும் எந்த குரலையும் பயன்படுத்தி இலவசமாக முன்பார்வை உருவாக்கலாம்.

முயற்சிக்கவும் Speaker 3 இப்பொழுது

எந்தவொரு உரையையும் தட்டச்சு செய்து அதை பேசுவதைக் கேட்கவும்Name Speaker 3. பயன்படுத்துவதற்கு இலவசம்.