VibeVoice

Speaker 2 (Chinese)

मुलभूत चीनीName Neutral VibeVoice

Speaker 2 (Chinese) हे neutral AI आवाज आहे जे VibeVoice पाठ्य- ते- वक्तव्य मॉडेल द्वारे चालविले जाते. हा मानक स्तर आवाज चीनीName बोलतो व स्टुडिओ- गुणवत्तेचे वक्तव्य संश्लेषण पुरवतो. याचा अर्थ असा की, जर द्रव्याचे द्रव्यमान व त्याचे गुरुत्व यांचे गुणोत्तर ५ असेल तर ते द्रव्यमान द्रव्यमान असते. यामुळे यंत्राच्या वापरात सुधारणा झाली व यंत्राचा वापर सुरक्षित बनला. मुख्य लेख: तत्त्वज्ञानातील संकल्पना

अद्याप दर्जा नाही

VibeVoiceआवृत्ती माहिती

मॉडेल VibeVoice
डेव्हलपर Microsoft
गुणवत्ता
वेग ठराविक
परवाना MIT
क्लोन करत आहे उपलब्ध नाही
जानेवारी चा मानक (2 क्रेडिट/ 1K अक्षरे)
परिमाणे 1.5B
आर्किटेक्चर LLM + DAC
प्रशिक्षण माहिती 100000 तास
वर्ष 2025

सर्वोत्तम वापराचे प्रकार Speaker 2 (Chinese)

या आवाजाच्या वैशिष्ट्यांवर आधारीत अनुप्रयोग

ऑडिओबुक व कथनName

याचे कारण म्हणजे या कोशात अनेक प्रकारचे शब्द व शब्दसमूह आहेत.

व्हिडीओ आवाज

याशिवाय, मराठी चित्रपट, दूरचित्रवाणी मालिका, सामाजिक विषयांवरील पुस्तके, वगैरे प्रकाशित केली.

अनुप्रयोग व प्राप्यताName

Fast generation makes this voice ideal for real-time apps, screen readers, and accessibility tools.

पॉडकास्ट व प्रसारणName

यासाठी वृत्तपत्रे, रेडिओ, दूरचित्रवाणी या माध्यमांचा वापर केला जातो.

अधिक VibeVoice आवाज

समान TTS मॉडेल पासून इतर आवाज

Speaker 1

इंग्लिशName Neutral

Speaker 1 (Chinese)

चीनीName Neutral

Speaker 2

इंग्लिशName Neutral

Speaker 3

इंग्लिशName Neutral

Speaker 4

इंग्लिशName Neutral

वारंवार विचारले जाणारे प्रश्न

मायक्रोसॉफ्टच्या व्हाइब्वाईसमध्ये दोन प्रकार आहेत: लांब स्वरूपाच्या संदर्भासाठी 1.5B मॉडेल (90 मिनिटांपर्यंत,4स्पीकर) आणि ~200ms प्रथम ऑडिओ लेटेंसीसह स्ट्रीमिंगसाठी रियलटाइम 0.5B मॉडेल.

मायक्रोसॉफ्टने विकसित केलेले व एमआयटी (अनुसंधान-केवळ उद्देश) परवाना अंतर्गत प्रकाशित केलेले, जे निर्माण झालेल्या ऑडिओचा व्यावसायिक वापर करण्यास परवानगी देते.

विकिमीडिया कॉमन्सवर १ संबंधित संचिका आहेत "इंग्रजी मजकूर".

VibeVoice प्रीमियम स्तरावर आहे -4क्रेडिट्स प्रति 1,000 अक्षरे. पूर्ण ऑडिओ निर्माण करण्यापूर्वी तुम्ही कोणत्याही VibeVoice आवाजाचे मोफत पूर्वदृश्य घेऊ शकता.

VibeVoice चा मध्यम निर्मिती वेग आहे. सामान्यतः निर्माण करीता काही सेकंद लागतात, पाठ्य लांबी वर अवलंबून.

VibeVoice ला TTS.ai वर ऑडिओ गुणवत्तेसाठी 5/5 गुण दिले गेले आहेत. ते स्टुडिओ-ग्रेड, मानवी-सारखे भाषण पुरवते.

नाही, VibeVoice अंतर्भूतीत आवाजांचे निश्चित समुह वापरते. आवाज क्लोन करीता, CosyVoice2, GPT-SoVITS किंवा Chatterbox सारखे मॉडेलचा वापर करा.

होय, VibeVoice विशेषतः पॉडकास्ट, ऑडिओबुक, लांब स्वरूप बहु-स्पीकर सामग्रीसाठी शिफारस केली जाते. त्याचे बहु-स्पीकर, 90 मिनिटांपर्यंत, पॉडकास्ट निर्मिती क्षमता या वापरासाठी एक उत्कृष्ट निवड करते.

होय, VibeVoice ला MIT (research-only intent) अंतर्गत परवाना आहे, जे व्यावसायिक वापरास परवानगी देते. VibeVoice आवाजांसह निर्माण केलेले ऑडिओ व्हिडिओ, पॉडकास्ट, अनुप्रयोग, खेळ, आणि इतर कोणत्याही व्यावसायिक प्रकल्पात वापरले जाऊ शकते.

होय, TTS.ai वरील सर्व आवाज व्यावसायिक-लाइसेन्स ओपन-सोर्स मॉडेल (MIT, Apache 2.0) वापरतात. निर्माण झालेले ऑडिओ व्हिडीओ, पॉडकास्ट, ऍप, खेळ, व इतर कोणत्याही व्यावसायिक अनुप्रयोगात वापरण्याकरीता तुमच्याकडे आहे.

/api/v1/tts/ याकडे मॉडेल नाव आणि आवाज ID सह POST विनंती पाठवा. पायथन, JavaScript, Go, आणि cURL मधील कोड उदाहरणांसाठी आमचे API दस्तऐवजीकरण पान पहा.

होय, या पानावरील चालवा बटणावर क्लिक करा, उदाहरण ऐकण्याकरीता. तुम्ही पाठ्य ते वक्तव्य पानावर इच्छिक पाठ्य टाइप करू शकता व कोणत्याही आवाजासह मोफत पूर्वदृश्य निर्माण करू शकता.

प्रयत्न करा Speaker 2 (Chinese) आता

कुठलेही पाठ्य टाइप करा व ते ऐकाName Speaker 2 (Chinese). वापरण्यासाठी मोफत.