VITS

Baker (Chinese)

ਮੁਫਤ ਚੀਨੀ Neutral VITS

Baker (Chinese) ਇੱਕ neutral AI ਆਵਾਜ਼ ਹੈ, ਜੋ ਕਿ VITS ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਨਾਲ ਚੱਲਦੀ ਹੈ । ਇਹ ਮੁਫਤ- ਪੱਧਰ ਆਵਾਜ਼ ਚੀਨੀ ਬੋਲਦੀ ਹੈ ਅਤੇ ਚੰਗਾ- ਕੁਆਲਟੀ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਦਿੰਦੀ ਹੈ । ਨੇੜੇ- ਤੁਰੰਤ ਪੈਦਾ ਕਰਨ ਦੀ ਗਤੀ ਅਤੇ 3/5 ਦੀ ਕੁਆਲਟੀ ਰੇਟਿੰਗ ਨਾਲ Baker (Chinese) general-purpose text-to-speech with natural prosody ਲਈ ਢੁਕਵਾਂ ਹੈ। VITS ਇੰਜਣ Jaehyeon Kim et al. under the MIT license ਵਲੋਂ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸੁਰੱਖਿਅਤ ਹੈ । ਮੁੱਖ ਸਮਰੱਥਾਵਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ: {ਫੀਚਰ}।

ਰੇਟਿੰਗ ਨਹੀਂ

VITSਮਾਡਲ ਜਾਣਕਾਰੀ

ਮਾਡਲ VITS
ਡਿਵੈਲਪਰ Jaehyeon Kim et al.
ਕੁਆਲਟੀ
ਸਪੀਡ ਸਥਿਰ
ਲਾਈਸੈਂਸ MIT
ਕਲੋਨਿੰਗ ਉਪਲੱਬਧ ਨਹੀਂ
ਜਾਨਵਰ ਮੁਕਤ (ਕੋਈ ਅੱਖਰ ਨਹੀਂ ਵਰਤੇ ਗਏ)
ਪੈਰਾਮੀਟਰ 25M
ਆਰਕੀਟੈਕਚਰ VAE + Normalizing Flows + GAN
ਟਰੇਨਿੰਗ ਡਾਟਾ 585 ਘੰਟੇ
ਸਾਲ 2021

ਇਸ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਵਰਤੋਂ ਕੇਸ Baker (Chinese)

ਇਸ ਆਵਾਜ਼ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਉੱਤੇ ਅਧਾਰਿਤ ਸਿਫਾਰਸ਼ੀ ਐਪਲੀਕੇਸ਼ਨ

ਆਡੀਓਬੁੱਕਾਂ ਅਤੇ ਗਾਇਨ

Baker (Chinese) ਨੂੰ ਲੰਬੇ ਫਾਰਮ ਸਮੱਗਰੀ ਨੂੰ ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਅਤੇ ਸਮੀਕਰਨ ਨਾਲ ਦੱਸਣ ਲਈ ਵਰਤੋਂ ।

ਵਿਡੀਓ ਬੋਲੀ

ਯੂਟਿਊਬ ਵਿਡੀਓਜ਼, ਐਡਸ ਅਤੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਸਮੱਗਰੀ ਲਈ ਪੇਸ਼ੇਵਰ ਨਾਂਅ ਸ਼ਾਮਲ ਕਰੋ।

ਐਪਲੀਕੇਸ਼ਨ ਅਤੇ ਪਹੁੰਚਯੋਗਤਾ

ਤੇਜ਼ ਪੈਦਾ ਕਰਨ ਨਾਲ ਇਹ ਆਵਾਜ਼ ਰੀਅਲ-ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨ, ਸਕਰੀਨ ਰੀਡਰ ਅਤੇ ਪਹੁੰਚਯੋਗ ਟੂਲ ਲਈ ਢੁਕਵੀਂ ਹੈ।

ਈ- ਸਿੱਖਿਆ ਅਤੇ ਟਰੇਨਿੰਗ

ਸਪਸ਼ਟ AI ਨਰੇਸ਼ਨ ਨਾਲ ਦਿਲਚਸਪ ਟ੍ਰੇਨਿੰਗ ਸਮੱਗਰੀ, ਕੋਰਸ ਅਤੇ ਸਿੱਖਿਆ ਸਮੱਗਰੀ ਬਣਾਓ।

ਹੋਰ VITS ਆਵਾਜ਼ਾਂ

ਇੱਕੋ TTS ਮਾਡਲ ਤੋਂ ਹੋਰ ਆਵਾਜ਼ਾਂ

Default

ਅੰਗਰੇਜ਼ੀ Neutral

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

VITS (ਵਰੀਏਸ਼ਨਲ ਇੰਫਰਰੇਸ਼ਨ ਨਾਲ ਐਂਡ- ਟੂ- ਐਂਡ ਟੈਕਸਟ- ਟੂ- ਸਪੀਚ ਲਈ ਵਿਰੋਧੀ ਸਿੱਖਣ) ਇੱਕ ਪੈਰਾਲੇਲ ਐਂਡ- ਟੂ- ਐਂਡ TTS ਢੰਗ ਹੈ, ਜੋ ਕਿ ਮੌਜੂਦਾ ਦੋ- ਪੜਾਅ ਮਾਡਲਾਂ ਨਾਲੋਂ ਵਧੇਰੇ ਕੁਦਰਤੀ ਸੁਣਨਯੋਗ ਆਡੀਓ ਪੈਦਾ ਕਰਦਾ ਹੈ । ਇਹ ਨਰਮਾਈ ਵਧਾਉਣ ਵਾਲੇ ਫਲੋ ਅਤੇ ਵਿਰੋਧੀ ਟਰੇਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਨਾਲ ਵਧਾਇਆ ਗਿਆ ਵਰੀਏਸ਼ਨਲ ਇੰਫਰਰੇਸ਼ਨ ਅਪਣਾਉਂਦਾ ਹੈ, ਜੋ ਕਿ ਕੁਦਰਤੀਤਾ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਲਿਆਉਂਦਾ ਹੈ ।

VITS ਨੂੰ Jaehyeon Kim et al. ਨੇ ਵਿਕਸਤ ਕੀਤਾ ਹੈ ਅਤੇ MIT ਲਾਇਸੈਂਸ ਅਧੀਨ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਬਣਾਈ ਆਡੀਓ ਦਾ ਵਪਾਰਕ ਵਰਤੋਂ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ।

VITS4ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੈ: ਅੰਗਰੇਜ਼ੀ, ਚੀਨੀ, ਜਪਾਨੀ, ਕੋਰੀਆਈ ।

VITS ਮੁਫਤ ਟਾਇਰ ਵਿੱਚ ਹੈ - ਮੁਫਤ - ਕੋਈ ਕ੍ਰੈਡਿਟ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ । ਤੁਸੀਂ ਪੂਰੀ ਆਡੀਓ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਕਿਸੇ ਵੀ VITS ਆਵਾਜ਼ ਦੀ ਮੁਫਤ ਝਲਕ ਵੇਖ ਸਕਦੇ ਹੋ ।

VITS ਦੀ ਬਹੁਤ ਤੇਜ਼ ਪੈਦਾ ਕਰਨ ਦੀ ਗਤੀ ਹੈ । ਇਹ ਰੀਅਲ- ਟਾਈਮ ਵਿੱਚ ਚੱਲਦਾ ਹੈ, ਇਸ ਨੂੰ ਸਟਰੀਮਿੰਗ ਅਤੇ ਇੰਟਰੈਕਟਿਵ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਢੁਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ ।

VITS ਨੂੰ TTS.ai ਉੱਤੇ ਆਡੀਓ ਕੁਆਲਟੀ ਲਈ 3/5ਰੇਟਿੰਗ ਦਿੱਤੀ ਗਈ ਹੈ । ਇਹ ਬਹੁਤੇ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਢੁੱਕਵੀਂ ਚੰਗੀ ਕੁਆਲਟੀ ਦੀ ਬੋਲੀ ਦਿੰਦਾ ਹੈ ।

ਨਹੀਂ, VITS ਇੱਕ ਨਿਸ਼ਚਿਤ ਸੈੱਟ ਅੰਦਰੂਨੀ ਆਵਾਜ਼ਾਂ ਵਰਤਦਾ ਹੈ। ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਲਈ, ਕੋਸੀਵਾਇਸ2ਜਾਂ GPT-SoVITS ਜਾਂ ਚੈਟਰਬਾਕਸ ਵਰਗੇ ਮਾਡਲ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ।

ਹਾਂ, VITS ਨੂੰ ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਨਾਲ ਆਮ- ਉਦੇਸ਼ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਲਈ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ । ਇਸ ਦਾ ਅੰਤ- ਤੋਂ- ਅੰਤ ਸੰਸਲੇਸ਼ਣ, ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ, ਤੇਜ਼ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਦੀ ਸਮਰੱਥਾ ਇਸ ਨੂੰ ਇਸ ਵਰਤੋਂ ਕੇਸ ਲਈ ਇੱਕ ਵਧੀਆ ਚੋਣ ਬਣਾਉਂਦੀ ਹੈ ।

ਹਾਂ, VITS ਨੂੰ MIT ਅਧੀਨ ਲਾਈਸੈਂਸ ਦਿੱਤੀ ਗਈ ਹੈ, ਜੋ ਕਿ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸਹਾਇਕ ਹੈ। VITS ਆਡੀਓ ਨਾਲ ਬਣਾਈ ਆਡੀਓ ਨੂੰ ਵੀਡਿਓ, ਪੋਡਕਾਸਟ, ਐਪਲੀਕੇਸ਼ਨ, ਖੇਡਾਂ ਅਤੇ ਹੋਰ ਵਪਾਰਕ ਪ੍ਰੋਜੈਕਟਾਂ ਵਿੱਚ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

ਹਾਂ, TTS.ai ਉੱਤੇ ਸਭ ਆਵਾਜ਼ਾਂ ਵਪਾਰਕ-ਲਾਈਸੈਂਸ ਖੋਲ੍ਹੇ-ਸਰੋਤ ਮਾਡਲ (MIT, Apache 2.0) ਵਰਤਦੀਆਂ ਹਨ। ਬਣਾਇਆ ਆਡੀਓ ਤੁਹਾਡੇ ਲਈ ਹੈ, ਜੋ ਕਿ ਵਿਡੀਓ, ਪੋਡਕਾਸਟ, ਐਪਲੀਕੇਸ਼ਨ, ਖੇਡਾਂ ਅਤੇ ਹੋਰ ਵਪਾਰਕ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

/api/v1/tts/ ਨੂੰ ਮਾਡਲ ਨਾਂ ਅਤੇ ਬੋਲੀ ID ਨਾਲ POST ਬੇਨਤੀ ਭੇਜੋ । ਪਾਈਥਨ, ਜਾਵਾ ਸਕ੍ਰਿਪਟ, ਗੋ ਅਤੇ cURL ਵਿੱਚ ਕੋਡ ਉਦਾਹਰਣਾਂ ਲਈ ਸਾਡਾ API ਡੌਕੂਮੈਂਟੇਸ਼ਨ ਪੇਜ਼ ਵੇਖੋ ।

ਹਾਂ, ਇੱਕ ਨਮੂਨਾ ਸੁਣਨ ਲਈ ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਚਲਾਓ ਬਟਨ ਨੂੰ ਦਬਾਉ । ਤੁਸੀਂ ਪਾਠ ਤੋਂ ਬੋਲੀ ਸਫ਼ੇ ਉੱਤੇ ਪਸੰਦੀਦਾ ਪਾਠ ਵੀ ਲਿਖ ਸਕਦੇ ਹੋ ਅਤੇ ਕਿਸੇ ਵੀ ਬੋਲੀ ਨਾਲ ਮੁਫ਼ਤ ਝਲਕ ਵੀ ਬਣਾ ਸਕਦੇ ਹੋ ।

ਕੋਸ਼ਿਸ Baker (Chinese) ਹੁਣ

ਕੋਈ ਵੀ ਟੈਕਸਟ ਲਿਖੋ ਅਤੇ ਸੁਣੋName Baker (Chinese). ਵਰਤਣ ਲਈ ਮੁਫਤ ਕੋਈ ਅੱਖਰ ਲੋੜੀਦਾ ਨਹੀਂ.