GPT-SoVITS

Default

मानक चीनी Neutral GPT-SoVITS

Default is a neutral AI voice powered by the GPT-SoVITS text-to-speech model. This मानक- टीआर voice speaks चीनी and delivers स्टूडियो-quality speech synthesis. With धीमी परंतु उच्च चाल generation speed and a quality rating of 5/5, Default is well-suited for voice cloning, singing synthesis, content creator voice replication. The GPT-SoVITS engine is developed by RVC-Boss under the MIT license, making it safe for commercial use. Key capabilities include: 5-second cloning, singing voice, few-shot learning, high fidelity, cross-lingual. GPT-SoVITS मॉडल आवाज़ को भी समर्थन देता है — एक छोटा - सा ऑडियो उदाहरण अपलोड करने के लिए जो एक रिवाज़ी आवाज़ को बनाए रखता है, जो एक ही गुण को बनाए रखता है ।

अभी तक कोई दरजा नहीं

GPT-SoVITSमॉडल जानकारी

मॉडल GPT-SoVITS
डेवलपर RVC-Boss
विशेषता
गति धीमा
लाइसेंस MIT
कलोनिंग समर्थित
टीयर मानक (2 श्रेय/ 1K अक्षर)
पैरामीटर्स 200M
अ- धातु GPT + SoVITS
वर्ष 2024

के लिए उत्तम उपयोग करें Default

इस आवाज की विशेषताओं पर आधारित अनुप्रयोग रीप्ले करें

ऑडियो-बुक व डायलॉग

Default का इस्तेमाल प्राकृतिक प्रोग्रामों तथा एक्सप्रेशन के साथ लंबी-रूप सामग्री बताने के लिए करें.

वीडियो आवाज चालू

यूट्यूब वीडियो, विज्ञापन, तथा सामाजिक मीडिया सामग्री में पेशेवर व्याख्यान जोड़ें.

पोस्ट- बिल्डिंग (P)

पथभ्रष्ट करनेवाले, रेडियो, और पेशेवर संगीत के लिए उपयुक्त आउटपुट.

मनपसंद Brand आवाज

विशिष्ट चित्रमय टीटीएस आवाज बनाने के लिए इस आवाज की शैली बनाएं.

अधिक GPT-SoVITS स्थिति

वही टीटी मॉडल से दूसरी आवाज़ें

English Default

अंग्रेज़ी Neutral

Japanese Default

जापानी Neutral

Korean Default

कोरियाई Neutral

बार बार पूछे जाने वाले प्रश्न

GEEGEGS GEGES GEGEGEGEGEGEEGEEGEGEGEGEEGEGEGEGEGEGEGEGEGEGEGEGEGEGEGEGEGEGEGENTEEEEEEGENTEGEGEGEGEGEGENTEGEGENTEN (ग्द्वेषण और प्रभावी आवाज और प्रभावी आवाजों के लिए आवाज के लिए आवाज और आवाज के माध्यम से आवाज के लिए आवाज के लिए आवाज के रूप में उपयोग कर रहा है।

GESVC-Bos द्वारा विकसित किया गया और एमएटी लाइसेंस के तहत प्रकाशित किया गया है, जो विकसित ऑडियो का व्यावसायिक उपयोग करने की अनुमति देता है.

GPT-VI 4 भाषाओं का समर्थन करता है: अंग्रेजी, चीनी, जापानी, कोरियाई.

GEPTTOS मानक टाई में है - 2 श्रेय प्रति 1,000 अक्षर. आप किसी भी जीटीएस आवाज को पूर्ण ऑडियो बनाने से पहले मुक्त करने के लिए देख सकते हैं.

GESICOND (प्रयोगात्मक गुणवत्ता) पीढ़ी की गति धीमी है. यह अब प्रति पीढ़ी लेता है लेकिन उच्च वफ़ादारी आउटपुट पैदा करता है.

GEPT-VIOS का दर TTS.ai पर ऑडियो गुणवत्ता के लिए है. यह स्टूडियो को सुरक्षित रखता है, मानव जैसा भाषा.

हाँ, GESECONT शून्य आवाज विरूद्ध समर्थित करता है. जुड़ता है 5-30 सेकंड का संदर्भ एक मनपसंद आवाज बनाने के लिए.

जी हाँ, GES-OGES खासतौर पर आवाज के लिए सिफ़ारिश की जाती है, गाना, सामग्री निर्माता आवाज फिर से शुरू. इसकी 5-दूसरे सेकेंड की आवाज़, कुछ नया सीखने की क्षमता यह इस मामले के लिए एक बढ़िया विकल्प बनाने के लिए एक अच्छा विकल्प है.

जी हाँ, जीटीएस एमआईटी के तहत लाइसेंस दिया गया है, जो व्यावसायिक उपयोग की अनुमति देता है.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

Gap/v1/ tuts के लिए एक Puepe/ट निवेदन भेजें मॉडल नाम और आवाज आईडी के साथ. हमारे एपीआई प्रलेखन पृष्ठों को पायथन, जावास्क्रिप्ट, और CUUx देखें.

जी हाँ, इस पृष्ठ पर खेल बटन को उदाहरण सुनने के लिए क्लिक करें. आप पाठ पृष्ठ पर टाइप कर सकते हैं तथा किसी भी आवाज से मुक्त पूर्वावलोकन तैयार कर सकते हैं.

कोशिश करें Default अब

किसी पाठ को टाइप करें तथा इसे बोले जा सकें Default. उपयोग के लिए मुक्त.