VITS

Default

मुक्त अंग्रेज़ी Neutral VITS

Default is a neutral AI voice powered by the VITS text-to-speech model. This फ्री- कॉलर voice speaks अंग्रेज़ी and delivers अच्छा-quality speech synthesis. With निकटस्थ लोग generation speed and a quality rating of 3/5, Default is well-suited for general-purpose text-to-speech with natural prosody. The VITS engine is developed by Jaehyeon Kim et al. under the MIT license, making it safe for commercial use. Key capabilities include: end-to-end synthesis, natural prosody, fast inference, multiple speakers.

अभी तक कोई दरजा नहीं

VITSमॉडल जानकारी

मॉडल VITS
डेवलपर Jaehyeon Kim et al.
विशेषता
गति तेज
लाइसेंस MIT
कलोनिंग उपलब्ध नहीं
टीयर फ्री (कोई अक्षर उपयोग में नहीं)
पैरामीटर्स 25M
अ- धातु VAE + Normalizing Flows + GAN
प्रशिक्षण डाटा 585 घंटे
वर्ष 2021

के लिए उत्तम उपयोग करें Default

इस आवाज की विशेषताओं पर आधारित अनुप्रयोग रीप्ले करें

ऑडियो-बुक व डायलॉग

Default का इस्तेमाल प्राकृतिक प्रोग्रामों तथा एक्सप्रेशन के साथ लंबी-रूप सामग्री बताने के लिए करें.

वीडियो आवाज चालू

यूट्यूब वीडियो, विज्ञापन, तथा सामाजिक मीडिया सामग्री में पेशेवर व्याख्यान जोड़ें.

पहुँच लागू करें (I)

तेज पीढ़ी के लिए यह आवाज वास्तविक समय ऐप, स्क्रीन रीडर्स, तथा पहुँच औज़ारों के लिए एक आदर्श बनाता है.

प्रशिक्षण व प्रशिक्षण

प्रशिक्षण सामग्री, कोर्स, और शैक्षिक विषय को स्पष्ट एआई कहानी से बनाएँ ।

अधिक VITS स्थिति

वही टीटी मॉडल से दूसरी आवाज़ें

CSS10 (Dutch)

डच Neutral

CSS10 (Finnish)

फिनिश Neutral

CSS10 (French)

फ्रेंच Neutral

CSS10 (German)

जर्मन Neutral

CSS10 (Hungarian)

हंगेरियाईName Neutral

CSS10 (Spanish)

स्पैनी अनुवाद Neutral

बार बार पूछे जाने वाले प्रश्न

MEGTS (अवर्थरकार के लिए एक अंत-से- वार्ता पाठ-से- वार्ता) सीखने के लिए एक समानांतर अंत-T-TC-TC-टी तरीका है जो मौजूदा दो मंच मॉडलों से अधिक प्राकृतिक ध्वनि बनाता है। यह सामान्य प्रवाह और एक मौजूदा प्रवाह और एक स्वाभाविक विकास, विकसित करने के लिए एक महत्वपूर्ण प्रक्रिया बनाता है।

VIINTE को यानम ईट अल ने विकसित किया था ।

VIS 4 भाषाओं का समर्थन करता है: अँग्रेज़ी, चीनी, जापानी, कोरियाई ।

आप पूरे ऑडियो को तैयार करने से पहले किसी भी VIITS की आवाज़ का पूर्वावलोकन कर सकते हैं ।

VIS बहुत तेज पीढ़ी है. यह वर्तमान समय के पास दौड़ता है, जिससे यह स्ट्रीमिंग तथा अंतःक्रियात्मक अनुप्रयोगों के लिए उपयुक्त बना देता है.

VITS का दर TTS.ai पर ऑडियो गुणवत्ता के लिए 3/5 है. यह अधिकतर अनुप्रयोगों के लिए उपयुक्त भाषण देता है.

नहीं, VITS ने बनाया हुआ आवाज के एक निश्चित सेट का उपयोग किया है. आवाज के लिए, कोसंस्फीत २ जीटीएस२ जैसे मॉडल की कोशिश करें.

जी हाँ, विशेष रूप से सामान्य-संत्र पाठ-से- वार्ता के लिए सिफारिश की जाती है प्राकृतिक अभ्यासों के साथ। इसके अंत-से-घन, प्राकृतिक, तेजी से यह इस मामले का उपयोग करने के लिए एक बेहतरीन विकल्प बनाने के लिए।

जी हाँ, VITS को एमटीटी के तहत लाइसेंस दिया जाता है, जो व्यापारिक उपयोग की अनुमति देता है ।

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

Gap/v1/ tuts के लिए एक Puepe/ट निवेदन भेजें मॉडल नाम और आवाज आईडी के साथ. हमारे एपीआई प्रलेखन पृष्ठों को पायथन, जावास्क्रिप्ट, और CUUx देखें.

जी हाँ, इस पृष्ठ पर खेल बटन को उदाहरण सुनने के लिए क्लिक करें. आप पाठ पृष्ठ पर टाइप कर सकते हैं तथा किसी भी आवाज से मुक्त पूर्वावलोकन तैयार कर सकते हैं.

कोशिश करें Default अब

किसी पाठ को टाइप करें तथा इसे बोले जा सकें Default. उपयोग के लिए मुक्त के साथ कोई अक्षर जरूरी नहीं.