VITS

Default

ਮੁਫਤ ਅੰਗਰੇਜ਼ੀ Neutral VITS

Default ਇੱਕ neutral AI ਆਵਾਜ਼ ਹੈ, ਜੋ ਕਿ VITS ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਨਾਲ ਚੱਲਦੀ ਹੈ । ਇਹ ਮੁਫਤ- ਪੱਧਰ ਆਵਾਜ਼ ਅੰਗਰੇਜ਼ੀ ਬੋਲਦੀ ਹੈ ਅਤੇ ਚੰਗਾ- ਕੁਆਲਟੀ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਦਿੰਦੀ ਹੈ । ਨੇੜੇ- ਤੁਰੰਤ ਪੈਦਾ ਕਰਨ ਦੀ ਗਤੀ ਅਤੇ 3/5 ਦੀ ਕੁਆਲਟੀ ਰੇਟਿੰਗ ਨਾਲ Default general-purpose text-to-speech with natural prosody ਲਈ ਢੁਕਵਾਂ ਹੈ। VITS ਇੰਜਣ Jaehyeon Kim et al. under the MIT license ਵਲੋਂ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸੁਰੱਖਿਅਤ ਹੈ । ਮੁੱਖ ਸਮਰੱਥਾਵਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ: {ਫੀਚਰ}।

ਰੇਟਿੰਗ ਨਹੀਂ

VITSਮਾਡਲ ਜਾਣਕਾਰੀ

ਮਾਡਲ VITS
ਡਿਵੈਲਪਰ Jaehyeon Kim et al.
ਕੁਆਲਟੀ
ਸਪੀਡ ਸਥਿਰ
ਲਾਈਸੈਂਸ MIT
ਕਲੋਨਿੰਗ ਉਪਲੱਬਧ ਨਹੀਂ
ਜਾਨਵਰ ਮੁਕਤ (ਕੋਈ ਅੱਖਰ ਨਹੀਂ ਵਰਤੇ ਗਏ)
ਪੈਰਾਮੀਟਰ 25M
ਆਰਕੀਟੈਕਚਰ VAE + Normalizing Flows + GAN
ਟਰੇਨਿੰਗ ਡਾਟਾ 585 ਘੰਟੇ
ਸਾਲ 2021

ਇਸ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਵਰਤੋਂ ਕੇਸ Default

ਇਸ ਆਵਾਜ਼ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਉੱਤੇ ਅਧਾਰਿਤ ਸਿਫਾਰਸ਼ੀ ਐਪਲੀਕੇਸ਼ਨ

ਆਡੀਓਬੁੱਕਾਂ ਅਤੇ ਗਾਇਨ

Default ਨੂੰ ਲੰਬੇ ਫਾਰਮ ਸਮੱਗਰੀ ਨੂੰ ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਅਤੇ ਸਮੀਕਰਨ ਨਾਲ ਦੱਸਣ ਲਈ ਵਰਤੋਂ ।

ਵਿਡੀਓ ਬੋਲੀ

ਯੂਟਿਊਬ ਵਿਡੀਓਜ਼, ਐਡਸ ਅਤੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਸਮੱਗਰੀ ਲਈ ਪੇਸ਼ੇਵਰ ਨਾਂਅ ਸ਼ਾਮਲ ਕਰੋ।

ਐਪਲੀਕੇਸ਼ਨ ਅਤੇ ਪਹੁੰਚਯੋਗਤਾ

ਤੇਜ਼ ਪੈਦਾ ਕਰਨ ਨਾਲ ਇਹ ਆਵਾਜ਼ ਰੀਅਲ-ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨ, ਸਕਰੀਨ ਰੀਡਰ ਅਤੇ ਪਹੁੰਚਯੋਗ ਟੂਲ ਲਈ ਢੁਕਵੀਂ ਹੈ।

ਈ- ਸਿੱਖਿਆ ਅਤੇ ਟਰੇਨਿੰਗ

ਸਪਸ਼ਟ AI ਨਰੇਸ਼ਨ ਨਾਲ ਦਿਲਚਸਪ ਟ੍ਰੇਨਿੰਗ ਸਮੱਗਰੀ, ਕੋਰਸ ਅਤੇ ਸਿੱਖਿਆ ਸਮੱਗਰੀ ਬਣਾਓ।

ਹੋਰ VITS ਆਵਾਜ਼ਾਂ

ਇੱਕੋ TTS ਮਾਡਲ ਤੋਂ ਹੋਰ ਆਵਾਜ਼ਾਂ

Baker (Chinese)

ਚੀਨੀ Neutral

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

VITS (ਵਰੀਏਸ਼ਨਲ ਇੰਫਰਰੇਸ਼ਨ ਨਾਲ ਐਂਡ- ਟੂ- ਐਂਡ ਟੈਕਸਟ- ਟੂ- ਸਪੀਚ ਲਈ ਵਿਰੋਧੀ ਸਿੱਖਣ) ਇੱਕ ਪੈਰਾਲੇਲ ਐਂਡ- ਟੂ- ਐਂਡ TTS ਢੰਗ ਹੈ, ਜੋ ਕਿ ਮੌਜੂਦਾ ਦੋ- ਪੜਾਅ ਮਾਡਲਾਂ ਨਾਲੋਂ ਵਧੇਰੇ ਕੁਦਰਤੀ ਸੁਣਨਯੋਗ ਆਡੀਓ ਪੈਦਾ ਕਰਦਾ ਹੈ । ਇਹ ਨਰਮਾਈ ਵਧਾਉਣ ਵਾਲੇ ਫਲੋ ਅਤੇ ਵਿਰੋਧੀ ਟਰੇਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਨਾਲ ਵਧਾਇਆ ਗਿਆ ਵਰੀਏਸ਼ਨਲ ਇੰਫਰਰੇਸ਼ਨ ਅਪਣਾਉਂਦਾ ਹੈ, ਜੋ ਕਿ ਕੁਦਰਤੀਤਾ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਲਿਆਉਂਦਾ ਹੈ ।

VITS ਨੂੰ Jaehyeon Kim et al. ਨੇ ਵਿਕਸਤ ਕੀਤਾ ਹੈ ਅਤੇ MIT ਲਾਇਸੈਂਸ ਅਧੀਨ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਬਣਾਈ ਆਡੀਓ ਦਾ ਵਪਾਰਕ ਵਰਤੋਂ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ।

VITS4ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੈ: ਅੰਗਰੇਜ਼ੀ, ਚੀਨੀ, ਜਪਾਨੀ, ਕੋਰੀਆਈ ।

VITS ਮੁਫਤ ਟਾਇਰ ਵਿੱਚ ਹੈ - ਮੁਫਤ - ਕੋਈ ਕ੍ਰੈਡਿਟ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ । ਤੁਸੀਂ ਪੂਰੀ ਆਡੀਓ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਕਿਸੇ ਵੀ VITS ਆਵਾਜ਼ ਦੀ ਮੁਫਤ ਝਲਕ ਵੇਖ ਸਕਦੇ ਹੋ ।

VITS ਦੀ ਬਹੁਤ ਤੇਜ਼ ਪੈਦਾ ਕਰਨ ਦੀ ਗਤੀ ਹੈ । ਇਹ ਰੀਅਲ- ਟਾਈਮ ਵਿੱਚ ਚੱਲਦਾ ਹੈ, ਇਸ ਨੂੰ ਸਟਰੀਮਿੰਗ ਅਤੇ ਇੰਟਰੈਕਟਿਵ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਢੁਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ ।

VITS ਨੂੰ TTS.ai ਉੱਤੇ ਆਡੀਓ ਕੁਆਲਟੀ ਲਈ 3/5ਰੇਟਿੰਗ ਦਿੱਤੀ ਗਈ ਹੈ । ਇਹ ਬਹੁਤੇ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਢੁੱਕਵੀਂ ਚੰਗੀ ਕੁਆਲਟੀ ਦੀ ਬੋਲੀ ਦਿੰਦਾ ਹੈ ।

ਨਹੀਂ, VITS ਇੱਕ ਨਿਸ਼ਚਿਤ ਸੈੱਟ ਅੰਦਰੂਨੀ ਆਵਾਜ਼ਾਂ ਵਰਤਦਾ ਹੈ। ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਲਈ, ਕੋਸੀਵਾਇਸ2ਜਾਂ GPT-SoVITS ਜਾਂ ਚੈਟਰਬਾਕਸ ਵਰਗੇ ਮਾਡਲ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ।

ਹਾਂ, VITS ਨੂੰ ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਨਾਲ ਆਮ- ਉਦੇਸ਼ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਲਈ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ । ਇਸ ਦਾ ਅੰਤ- ਤੋਂ- ਅੰਤ ਸੰਸਲੇਸ਼ਣ, ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ, ਤੇਜ਼ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਦੀ ਸਮਰੱਥਾ ਇਸ ਨੂੰ ਇਸ ਵਰਤੋਂ ਕੇਸ ਲਈ ਇੱਕ ਵਧੀਆ ਚੋਣ ਬਣਾਉਂਦੀ ਹੈ ।

ਹਾਂ, VITS ਨੂੰ MIT ਅਧੀਨ ਲਾਈਸੈਂਸ ਦਿੱਤੀ ਗਈ ਹੈ, ਜੋ ਕਿ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸਹਾਇਕ ਹੈ। VITS ਆਡੀਓ ਨਾਲ ਬਣਾਈ ਆਡੀਓ ਨੂੰ ਵੀਡਿਓ, ਪੋਡਕਾਸਟ, ਐਪਲੀਕੇਸ਼ਨ, ਖੇਡਾਂ ਅਤੇ ਹੋਰ ਵਪਾਰਕ ਪ੍ਰੋਜੈਕਟਾਂ ਵਿੱਚ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

ਹਾਂ, TTS.ai ਉੱਤੇ ਸਭ ਆਵਾਜ਼ਾਂ ਵਪਾਰਕ-ਲਾਈਸੈਂਸ ਖੋਲ੍ਹੇ-ਸਰੋਤ ਮਾਡਲ (MIT, Apache 2.0) ਵਰਤਦੀਆਂ ਹਨ। ਬਣਾਇਆ ਆਡੀਓ ਤੁਹਾਡੇ ਲਈ ਹੈ, ਜੋ ਕਿ ਵਿਡੀਓ, ਪੋਡਕਾਸਟ, ਐਪਲੀਕੇਸ਼ਨ, ਖੇਡਾਂ ਅਤੇ ਹੋਰ ਵਪਾਰਕ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

/api/v1/tts/ ਨੂੰ ਮਾਡਲ ਨਾਂ ਅਤੇ ਬੋਲੀ ID ਨਾਲ POST ਬੇਨਤੀ ਭੇਜੋ । ਪਾਈਥਨ, ਜਾਵਾ ਸਕ੍ਰਿਪਟ, ਗੋ ਅਤੇ cURL ਵਿੱਚ ਕੋਡ ਉਦਾਹਰਣਾਂ ਲਈ ਸਾਡਾ API ਡੌਕੂਮੈਂਟੇਸ਼ਨ ਪੇਜ਼ ਵੇਖੋ ।

ਹਾਂ, ਇੱਕ ਨਮੂਨਾ ਸੁਣਨ ਲਈ ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਚਲਾਓ ਬਟਨ ਨੂੰ ਦਬਾਉ । ਤੁਸੀਂ ਪਾਠ ਤੋਂ ਬੋਲੀ ਸਫ਼ੇ ਉੱਤੇ ਪਸੰਦੀਦਾ ਪਾਠ ਵੀ ਲਿਖ ਸਕਦੇ ਹੋ ਅਤੇ ਕਿਸੇ ਵੀ ਬੋਲੀ ਨਾਲ ਮੁਫ਼ਤ ਝਲਕ ਵੀ ਬਣਾ ਸਕਦੇ ਹੋ ।

ਕੋਸ਼ਿਸ Default ਹੁਣ

ਕੋਈ ਵੀ ਟੈਕਸਟ ਲਿਖੋ ਅਤੇ ਸੁਣੋName Default. ਵਰਤਣ ਲਈ ਮੁਫਤ ਕੋਈ ਅੱਖਰ ਲੋੜੀਦਾ ਨਹੀਂ.