StyleTTS 2

Default

ਪ੍ਰੀਮੀਅਮ ਅੰਗਰੇਜ਼ੀ Neutral StyleTTS 2

Default ਇੱਕ neutral AI ਆਵਾਜ਼ ਹੈ, ਜੋ ਕਿ StyleTTS 2 ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਨਾਲ ਚੱਲਦੀ ਹੈ । ਇਹ ਪ੍ਰੀਮੀਅਮ- ਟਾਇਰ ਆਵਾਜ਼ ਅੰਗਰੇਜ਼ੀ ਬੋਲਦੀ ਹੈ ਅਤੇ ਸਟੂਡੀਓ- ਕੁਆਲਟੀ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਦਿੰਦੀ ਹੈ । ਮੱਧਮ ਪੈਦਾ ਕਰਨ ਦੀ ਗਤੀ ਅਤੇ 5/5 ਦੀ ਕੁਆਲਟੀ ਰੇਟਿੰਗ ਨਾਲ Default studio-quality single-speaker synthesis, professional narration ਲਈ ਢੁਕਵਾਂ ਹੈ। StyleTTS 2 ਇੰਜਣ Columbia University under the MIT license ਵਲੋਂ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸੁਰੱਖਿਅਤ ਹੈ । ਮੁੱਖ ਸਮਰੱਥਾਵਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ: {ਫੀਚਰ}।

ਰੇਟਿੰਗ ਨਹੀਂ

StyleTTS 2ਮਾਡਲ ਜਾਣਕਾਰੀ

ਮਾਡਲ StyleTTS 2
ਡਿਵੈਲਪਰ Columbia University
ਕੁਆਲਟੀ
ਸਪੀਡ ਮੀਡਿਆ
ਲਾਈਸੈਂਸ MIT
ਕਲੋਨਿੰਗ ਉਪਲੱਬਧ ਨਹੀਂ
ਜਾਨਵਰ ਪ੍ਰੀਮੀਅਮ (4 ਕਰੈਡਿਟ/ 1K ਅੱਖਰ)
ਪੈਰਾਮੀਟਰ 100M
ਆਰਕੀਟੈਕਚਰ Style Diffusion + Adversarial Training
ਟਰੇਨਿੰਗ ਡਾਟਾ 585 ਘੰਟੇ
ਸਾਲ 2024

ਇਸ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਵਰਤੋਂ ਕੇਸ Default

ਇਸ ਆਵਾਜ਼ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਉੱਤੇ ਅਧਾਰਿਤ ਸਿਫਾਰਸ਼ੀ ਐਪਲੀਕੇਸ਼ਨ

ਆਡੀਓਬੁੱਕਾਂ ਅਤੇ ਗਾਇਨ

Default ਨੂੰ ਲੰਬੇ ਫਾਰਮ ਸਮੱਗਰੀ ਨੂੰ ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਅਤੇ ਸਮੀਕਰਨ ਨਾਲ ਦੱਸਣ ਲਈ ਵਰਤੋਂ ।

ਵਿਡੀਓ ਬੋਲੀ

ਯੂਟਿਊਬ ਵਿਡੀਓਜ਼, ਐਡਸ ਅਤੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਸਮੱਗਰੀ ਲਈ ਪੇਸ਼ੇਵਰ ਨਾਂਅ ਸ਼ਾਮਲ ਕਰੋ।

ਪੋਡਕਾਸਟ ਅਤੇ ਬਰਾਡਕਾਸਟ

ਸਟੂਡੀਓ- ਕੁਆਲਟੀ ਆਉਟਪੁੱਟ ਪੋਡਕਾਸਟ, ਰੇਡੀਓ ਅਤੇ ਪਰੋਫੈਸ਼ਨਲ ਬਰਾਡਕਾਸਟ ਲਈ ਢੁੱਕਵਾਂ ਹੈ ।

ਖੇਡਾਂ ਅਤੇ ਇੰਟਰੈਕਟਿਵ ਮੀਡਿਆ

ਖੇਡ ਡਾਈਲਾਗ, ਇੰਟਰੈਕਟਿਵ ਕਹਾਣੀਆਂ ਅਤੇ ਸਮਰਪਿਤ ਅਨੁਭਵ ਲਈ ਪ੍ਰੀਮੀਅਮ ਕੁਆਲਟੀ।

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

StyleTTS2ਵਿੱਚ ਵੱਡੇ ਬੋਲੀ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਟਾਈਲ ਡਿਫਿਊਜ਼ਨ ਅਤੇ ਵਿਰੋਧੀ ਟਰੇਨਿੰਗ ਨੂੰ ਮਿਲਾ ਕੇ ਮਨੁੱਖੀ- ਪੱਧਰ TTS ਸੰਸਲੇਸ਼ਣ ਪ੍ਰਾਪਤ ਹੁੰਦਾ ਹੈ । ਇਹ ਇੱਕਲੇ ਬੋਲਣ ਵਾਲੇ ਮਾਡਲਾਂ ਵਿੱਚ ਸਭ ਤੋਂ ਕੁਦਰਤੀ ਸੁਣਨਯੋਗ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ, ਜੋ ਕਿ ਮਨੁੱਖੀ ਰਿਕਾਰਡਿੰਗ ਨਾਲ ਮੁਕਾਬਲਾ ਕਰਦਾ ਹੈ । StyleTTS2ਵਿਚ ਡਿਫਿਊਜ਼ਨ ਅਧਾਰਿਤ ਸਟਾਈਲ ਮਾਡਲਿੰਗ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਜੋ ਕਿ ਮਨੁੱਖੀ ਬੋਲੀ ਦੀਆਂ ਵੱਖ- ਵੱਖ ਕਿਸਮਾਂ ਨੂੰ ਪੂਰੀ ਰੇਜ਼ ਤੱਕ ਫੜਦੀ ਹੈ ।

StyleTTS2ਕੋਲੰਬੀਆ ਯੂਨੀਵਰਸਿਟੀ ਵਲੋਂ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ MIT ਲਾਇਸੈਂਸ ਅਧੀਨ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਬਣਾਈ ਆਡੀਓ ਦਾ ਵਪਾਰਕ ਵਰਤੋਂ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ ।

StyleTTS21 ਭਾਸ਼ਾ ਲਈ ਸਹਾਇਕ ਹੈ: ਅੰਗਰੇਜ਼ੀ ।

StyleTTS2ਪ੍ਰੀਮੀਅਮ ਟਾਇਰ ਵਿੱਚ ਹੈ - ਪ੍ਰਤੀ 1,000 ਅੱਖਰ4ਕਰਡ ਹਨ । ਤੁਸੀਂ ਪੂਰੀ ਆਡੀਓ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਕਿਸੇ ਵੀ StyleTTS2ਵਾਕਫਾਇਰ ਦੀ ਮੁਫਤ ਝਲਕ ਵੇਖ ਸਕਦੇ ਹੋ ।

ਸਟਾਈਲTTS2ਦੀ ਪੈਦਾ ਕਰਨ ਦੀ ਗਤੀ ਮੱਧਮ ਹੈ । ਪੈਦਾ ਕਰਨ ਵਿੱਚ ਆਮ ਤੌਰ ਉੱਤੇ ਕੁਝ ਸਕਿੰਟ ਲੱਗਦੇ ਹਨ, ਜੋ ਕਿ ਪਾਠ ਲੰਬਾਈ ਉੱਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ ।

StyleTTS2ਨੂੰ TTS.ai ਉੱਤੇ ਆਡੀਓ ਕੁਆਲਟੀ ਲਈ 5/5ਰੇਟਿੰਗ ਦਿੱਤੀ ਗਈ ਹੈ । ਇਹ ਸਟੂਡੀਓ-ਗਰੇਡ, ਮਨੁੱਖੀ-ਜੋੜੀ ਬੋਲੀ ਦਿੰਦਾ ਹੈ ।

ਨਹੀਂ, StyleTTS2ਬਹੁਤ ਹੀ ਢੁੱਕਵੀਂਆਂ ਆਵਾਜ਼ਾਂ ਵਰਤਦਾ ਹੈ । ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਲਈ, CosyVoice2, GPT- SoVITS ਜਾਂ Chatterbox ਵਰਗੇ ਮਾਡਲ ਵਰਤੋਂ ।

ਹਾਂ, StyleTTS2ਨੂੰ ਸਟੂਡੀਓ- ਕੁਆਲਟੀ ਇੱਕਲੇ ਸਪੀਕਰ ਸੰਸਲੇਸ਼ਣ, ਪੇਸ਼ੇਵਰ ਨਾਂਅ- ਪਛਾਣ ਲਈ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ । ਇਸ ਦੀਆਂ ਮਨੁੱਖੀ- ਪੱਧਰ, ਸਟਾਈਲ ਫੈਲਾਅ, ਵਿਰੋਧੀ ਟਰੇਨਿੰਗ ਸਮਰੱਥਾਵਾਂ ਇਸ ਨੂੰ ਇਸ ਵਰਤੋਂ ਕੇਸ ਲਈ ਇੱਕ ਵਧੀਆ ਚੋਣ ਬਣਾਉਂਦੀਆਂ ਹਨ ।

ਹਾਂ, StyleTTS2ਨੂੰ MIT ਦੀ ਲਾਈਸੈਂਸ ਦਿੱਤੀ ਗਈ ਹੈ, ਜੋ ਕਿ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸਹਾਇਕ ਹੈ। StyleTTS2ਦੇ ਨਾਲ ਬਣਾਈ ਆਡੀਓ ਆਵਾਜ਼ ਨੂੰ ਵੀਡਿਓ, ਪੋਡਕਾਸਟ, ਐਪਲੀਕੇਸ਼ਨ, ਖੇਡਾਂ ਅਤੇ ਹੋਰ ਵਪਾਰਕ ਪ੍ਰੋਜੈਕਟਾਂ ਵਿੱਚ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

ਹਾਂ, TTS.ai ਉੱਤੇ ਸਭ ਆਵਾਜ਼ਾਂ ਵਪਾਰਕ-ਲਾਈਸੈਂਸ ਖੋਲ੍ਹੇ-ਸਰੋਤ ਮਾਡਲ (MIT, Apache 2.0) ਵਰਤਦੀਆਂ ਹਨ। ਬਣਾਇਆ ਆਡੀਓ ਤੁਹਾਡੇ ਲਈ ਹੈ, ਜੋ ਕਿ ਵਿਡੀਓ, ਪੋਡਕਾਸਟ, ਐਪਲੀਕੇਸ਼ਨ, ਖੇਡਾਂ ਅਤੇ ਹੋਰ ਵਪਾਰਕ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

/api/v1/tts/ ਨੂੰ ਮਾਡਲ ਨਾਂ ਅਤੇ ਬੋਲੀ ID ਨਾਲ POST ਬੇਨਤੀ ਭੇਜੋ । ਪਾਈਥਨ, ਜਾਵਾ ਸਕ੍ਰਿਪਟ, ਗੋ ਅਤੇ cURL ਵਿੱਚ ਕੋਡ ਉਦਾਹਰਣਾਂ ਲਈ ਸਾਡਾ API ਡੌਕੂਮੈਂਟੇਸ਼ਨ ਪੇਜ਼ ਵੇਖੋ ।

ਹਾਂ, ਇੱਕ ਨਮੂਨਾ ਸੁਣਨ ਲਈ ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਚਲਾਓ ਬਟਨ ਨੂੰ ਦਬਾਉ । ਤੁਸੀਂ ਪਾਠ ਤੋਂ ਬੋਲੀ ਸਫ਼ੇ ਉੱਤੇ ਪਸੰਦੀਦਾ ਪਾਠ ਵੀ ਲਿਖ ਸਕਦੇ ਹੋ ਅਤੇ ਕਿਸੇ ਵੀ ਬੋਲੀ ਨਾਲ ਮੁਫ਼ਤ ਝਲਕ ਵੀ ਬਣਾ ਸਕਦੇ ਹੋ ।

ਕੋਸ਼ਿਸ Default ਹੁਣ

ਕੋਈ ਵੀ ਟੈਕਸਟ ਲਿਖੋ ਅਤੇ ਸੁਣੋName Default. ਵਰਤਣ ਲਈ ਮੁਫਤ.