VibeVoice

Speaker 1

मानक अंग्रेज़ी Neutral VibeVoice

Speaker 1 is a neutral AI voice powered by the VibeVoice text-to-speech model. This मानक- टीआर voice speaks अंग्रेज़ी and delivers स्टूडियो-quality speech synthesis. With निकटस्थ लोग generation speed and a quality rating of 5/5, Speaker 1 is well-suited for podcasts, dialogues, long-form narration, multi-speaker content. The VibeVoice engine is developed by Microsoft under the MIT license, making it safe for commercial use. Key capabilities include: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

अभी तक कोई दरजा नहीं

VibeVoiceमॉडल जानकारी

मॉडल VibeVoice
डेवलपर Microsoft
विशेषता
गति तेज
लाइसेंस MIT
कलोनिंग उपलब्ध नहीं
टीयर मानक (2 श्रेय/ 1K अक्षर)
पैरामीटर्स 1.5B
अ- धातु LLM + DAC
प्रशिक्षण डाटा 100000 घंटे
वर्ष 2025

के लिए उत्तम उपयोग करें Speaker 1

इस आवाज की विशेषताओं पर आधारित अनुप्रयोग रीप्ले करें

ऑडियो-बुक व डायलॉग

Speaker 1 का इस्तेमाल प्राकृतिक प्रोग्रामों तथा एक्सप्रेशन के साथ लंबी-रूप सामग्री बताने के लिए करें.

वीडियो आवाज चालू

यूट्यूब वीडियो, विज्ञापन, तथा सामाजिक मीडिया सामग्री में पेशेवर व्याख्यान जोड़ें.

पहुँच लागू करें (I)

तेज पीढ़ी के लिए यह आवाज वास्तविक समय ऐप, स्क्रीन रीडर्स, तथा पहुँच औज़ारों के लिए एक आदर्श बनाता है.

पोस्ट- बिल्डिंग (P)

पथभ्रष्ट करनेवाले, रेडियो, और पेशेवर संगीत के लिए उपयुक्त आउटपुट.

अधिक VibeVoice स्थिति

वही टीटी मॉडल से दूसरी आवाज़ें

Speaker 1 (Chinese)

चीनी Neutral

Speaker 2

अंग्रेज़ी Neutral

Speaker 2 (Chinese)

चीनी Neutral

Speaker 3

अंग्रेज़ी Neutral

Speaker 4

अंग्रेज़ी Neutral

बार बार पूछे जाने वाले प्रश्न

Gibegarig द्वारा दो प्रकारों में आता है: लंबी सामग्री के लिए एक 1.ByB मॉडल (या 90 मिनट के लिए) और वास्तविक समय मूल्य 0.5B मॉडल के लिए ~200s पहली देर के साथ स्ट्रीमिंग के लिए. 1. 1. 1. 1. 1. 1. 1. 1-bs और लंबे समय के द्वारा स्पीकर द्वारा दर्ज किया गया Gobs: MicrosoftS कोड हटा दिया गया और ऑडियो भंडारों से निर्मित ऑडियो संग्रह शामिल करता है.

वीआईबीF को Microsoft द्वारा विकसित किया गया था और एमआईटी (सिर्फ ढूंढने के लिए) लाइसेंस के तहत प्रकाशित किया गया है, जो उत्पन्न किए गए ऑडियो के व्यापारिक उपयोग की अनुमति देता है.

वीआईबीFestivalVoiceName

वीआईबीFFecrer में है — प्रति १,००० अक्षरों का श्रेय ।

वीआईबीFestivalVoiceName

VibeFFest का दर TTS.ai पर ऑडियो गुणवत्ता के लिए 5/5 है. यह स्टूडियो, मानव जैसा भाषण देता है.

नहीं, VibepF ने निर्माण आवाज के एक स्थिर सेट का उपयोग किया है. आवाज के लिए, कोसीय 2 GESCOS, या चैटबॉक्स की तरह मॉडल कोशिश करें.

जी हाँ, fibeF को विशेष रूप से fids, ऑडियोबुक, लंबी- चौड़ी बहु-विधक सामग्री के लिए सिफ़ारिश की जाती है. इसके बहु-से-cras, 90 मिनट तक, podPPCable यह इस मामले का उपयोग करने के लिए एक बढ़िया विकल्प बनाने के लिए एक अच्छा विकल्प बनाता है.

जी हाँ, वीबीF लाइसेंस एमआईटी (सिर्फ इसी इरादे से) दिया गया है, जो व्यावसायिक उपयोग की अनुमति देता है. वीआईबी ध्वनि के साथ इस्तेमाल किया जा सकता है वीडियो, डिस्क, ए.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

Gap/v1/ tuts के लिए एक Puepe/ट निवेदन भेजें मॉडल नाम और आवाज आईडी के साथ. हमारे एपीआई प्रलेखन पृष्ठों को पायथन, जावास्क्रिप्ट, और CUUx देखें.

जी हाँ, इस पृष्ठ पर खेल बटन को उदाहरण सुनने के लिए क्लिक करें. आप पाठ पृष्ठ पर टाइप कर सकते हैं तथा किसी भी आवाज से मुक्त पूर्वावलोकन तैयार कर सकते हैं.

कोशिश करें Speaker 1 अब

किसी पाठ को टाइप करें तथा इसे बोले जा सकें Speaker 1. उपयोग के लिए मुक्त.