Default

ਮੁਫਤ ਅੰਗਰੇਜ਼ੀ Neutral

VITS

Default ਇੱਕ neutral AI ਆਵਾਜ਼ ਹੈ, ਜੋ ਕਿ VITS ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਮਾਡਲ ਨਾਲ ਚੱਲਦੀ ਹੈ । ਇਹ ਮੁਫਤ- ਪੱਧਰ ਆਵਾਜ਼ ਅੰਗਰੇਜ਼ੀ ਬੋਲਦੀ ਹੈ ਅਤੇ ਚੰਗਾ- ਕੁਆਲਟੀ ਬੋਲੀ ਸੰਸਲੇਸ਼ਣ ਦਿੰਦੀ ਹੈ । ਨੇੜੇ- ਤੁਰੰਤ ਪੈਦਾ ਕਰਨ ਦੀ ਗਤੀ ਅਤੇ 3/5 ਦੀ ਕੁਆਲਟੀ ਰੇਟਿੰਗ ਨਾਲ Default general-purpose text-to-speech with natural prosody ਲਈ ਢੁਕਵਾਂ ਹੈ। VITS ਇੰਜਣ Jaehyeon Kim et al. under the MIT license ਵਲੋਂ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸੁਰੱਖਿਅਤ ਹੈ । Key capabilities include: end-to-end synthesis, natural prosody, fast inference, multiple speakers.

ਰੇਟਿੰਗ ਨਹੀਂ

ਇਹ ਆਵਾਜ਼ ਕੋਸ਼ਿਸ਼ ਕਰੋ ਸਭ VITS ਆਵਾਜ਼ਾਂ

ਮਾਡਲ ਜਾਣਕਾਰੀ

ਮਾਡਲ	VITS
ਡਿਵੈਲਪਰ	Jaehyeon Kim et al.
ਕੁਆਲਟੀ
ਸਪੀਡ	ਸਥਿਰ
ਲਾਈਸੈਂਸ	MIT
ਕਲੋਨਿੰਗ	ਉਪਲੱਬਧ ਨਹੀਂ
ਜਾਨਵਰ	ਮੁਕਤ (ਕੋਈ ਅੱਖਰ ਨਹੀਂ ਵਰਤੇ ਗਏ)
ਪੈਰਾਮੀਟਰ	25M
ਆਰਕੀਟੈਕਚਰ	VAE + Normalizing Flows + GAN
ਟਰੇਨਿੰਗ ਡਾਟਾ	585 ਘੰਟੇ
ਸਾਲ	2021

ਇਸ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਵਰਤੋਂ ਕੇਸ Default

ਇਸ ਆਵਾਜ਼ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਉੱਤੇ ਅਧਾਰਿਤ ਸਿਫਾਰਸ਼ੀ ਐਪਲੀਕੇਸ਼ਨ

ਆਡੀਓਬੁੱਕਾਂ ਅਤੇ ਗਾਇਨ

Default ਨੂੰ ਲੰਬੇ ਫਾਰਮ ਸਮੱਗਰੀ ਨੂੰ ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਅਤੇ ਸਮੀਕਰਨ ਨਾਲ ਦੱਸਣ ਲਈ ਵਰਤੋਂ ।

ਵਿਡੀਓ ਬੋਲੀ

ਯੂਟਿਊਬ ਵਿਡੀਓਜ਼, ਐਡਸ ਅਤੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਸਮੱਗਰੀ ਲਈ ਪੇਸ਼ੇਵਰ ਨਾਂਅ ਸ਼ਾਮਲ ਕਰੋ।

ਐਪਲੀਕੇਸ਼ਨ ਅਤੇ ਪਹੁੰਚਯੋਗਤਾ

ਤੇਜ਼ ਪੈਦਾ ਕਰਨ ਨਾਲ ਇਹ ਆਵਾਜ਼ ਰੀਅਲ-ਟਾਈਮ ਐਪਲੀਕੇਸ਼ਨ, ਸਕਰੀਨ ਰੀਡਰ ਅਤੇ ਪਹੁੰਚਯੋਗ ਟੂਲ ਲਈ ਢੁਕਵੀਂ ਹੈ।

ਈ- ਸਿੱਖਿਆ ਅਤੇ ਟਰੇਨਿੰਗ

ਸਪਸ਼ਟ AI ਨਰੇਸ਼ਨ ਨਾਲ ਦਿਲਚਸਪ ਟ੍ਰੇਨਿੰਗ ਸਮੱਗਰੀ, ਕੋਰਸ ਅਤੇ ਸਿੱਖਿਆ ਸਮੱਗਰੀ ਬਣਾਓ।

ਹੋਰ VITS ਆਵਾਜ਼ਾਂ

ਇੱਕੋ TTS ਮਾਡਲ ਤੋਂ ਹੋਰ ਆਵਾਜ਼ਾਂ

CSS10 (Dutch)

ਡੱਚ Neutral

CSS10 (Finnish)

ਫਿਨਿਸ਼ Neutral

CSS10 (French)

ਫਰੈਂਚ Neutral

CSS10 (German)

ਜਰਮਨ Neutral

CSS10 (Hungarian)

ਹੰਗਰੀਆਈ Neutral

CSS10 (Spanish)

ਸਪੇਨੀ Neutral

ਸਭ ਵੇਖੋ VITS ਆਵਾਜ਼ਾਂ

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

VITS (ਵਰੀਏਸ਼ਨਲ ਇੰਫਰਰੇਸ਼ਨ ਨਾਲ ਐਂਡ- ਟੂ- ਐਂਡ ਟੈਕਸਟ- ਟੂ- ਸਪੀਚ ਲਈ ਵਿਰੋਧੀ ਸਿੱਖਣ) ਇੱਕ ਪੈਰਾਲੇਲ ਐਂਡ- ਟੂ- ਐਂਡ TTS ਢੰਗ ਹੈ, ਜੋ ਕਿ ਮੌਜੂਦਾ ਦੋ- ਪੜਾਅ ਮਾਡਲਾਂ ਨਾਲੋਂ ਵਧੇਰੇ ਕੁਦਰਤੀ ਸੁਣਨਯੋਗ ਆਡੀਓ ਪੈਦਾ ਕਰਦਾ ਹੈ । ਇਹ ਨਰਮਾਈ ਵਧਾਉਣ ਵਾਲੇ ਫਲੋ ਅਤੇ ਵਿਰੋਧੀ ਟਰੇਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਨਾਲ ਵਧਾਇਆ ਗਿਆ ਵਰੀਏਸ਼ਨਲ ਇੰਫਰਰੇਸ਼ਨ ਅਪਣਾਉਂਦਾ ਹੈ, ਜੋ ਕਿ ਕੁਦਰਤੀਤਾ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਸੁਧਾਰ ਲਿਆਉਂਦਾ ਹੈ ।

VITS ਨੂੰ Jaehyeon Kim et al. ਨੇ ਵਿਕਸਤ ਕੀਤਾ ਹੈ ਅਤੇ MIT ਲਾਇਸੈਂਸ ਅਧੀਨ ਜਾਰੀ ਕੀਤਾ ਗਿਆ ਹੈ, ਜੋ ਕਿ ਬਣਾਈ ਆਡੀਓ ਦਾ ਵਪਾਰਕ ਵਰਤੋਂ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ।

VITS4ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੈ: ਅੰਗਰੇਜ਼ੀ, ਚੀਨੀ, ਜਪਾਨੀ, ਕੋਰੀਆਈ ।

VITS ਮੁਫਤ ਟਾਇਰ ਵਿੱਚ ਹੈ - ਮੁਫਤ - ਕੋਈ ਕ੍ਰੈਡਿਟ ਲੋੜੀਦਾ ਨਹੀਂ ਹੈ । ਤੁਸੀਂ ਪੂਰੀ ਆਡੀਓ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਕਿਸੇ ਵੀ VITS ਆਵਾਜ਼ ਦੀ ਮੁਫਤ ਝਲਕ ਵੇਖ ਸਕਦੇ ਹੋ ।

VITS ਦੀ ਬਹੁਤ ਤੇਜ਼ ਪੈਦਾ ਕਰਨ ਦੀ ਗਤੀ ਹੈ । ਇਹ ਰੀਅਲ- ਟਾਈਮ ਵਿੱਚ ਚੱਲਦਾ ਹੈ, ਇਸ ਨੂੰ ਸਟਰੀਮਿੰਗ ਅਤੇ ਇੰਟਰੈਕਟਿਵ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਢੁਕਵਾਂ ਬਣਾਉਂਦਾ ਹੈ ।

VITS ਨੂੰ TTS.ai ਉੱਤੇ ਆਡੀਓ ਕੁਆਲਟੀ ਲਈ 3/5ਰੇਟਿੰਗ ਦਿੱਤੀ ਗਈ ਹੈ । ਇਹ ਬਹੁਤੇ ਐਪਲੀਕੇਸ਼ਨ ਲਈ ਢੁੱਕਵੀਂ ਚੰਗੀ ਕੁਆਲਟੀ ਦੀ ਬੋਲੀ ਦਿੰਦਾ ਹੈ ।

ਨਹੀਂ, VITS ਇੱਕ ਨਿਸ਼ਚਿਤ ਸੈੱਟ ਅੰਦਰੂਨੀ ਆਵਾਜ਼ਾਂ ਵਰਤਦਾ ਹੈ। ਆਵਾਜ਼ ਕਲੋਨਿੰਗ ਲਈ, ਕੋਸੀਵਾਇਸ2ਜਾਂ GPT-SoVITS ਜਾਂ ਚੈਟਰਬਾਕਸ ਵਰਗੇ ਮਾਡਲ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ।

ਹਾਂ, VITS ਨੂੰ ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ ਨਾਲ ਆਮ- ਉਦੇਸ਼ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਲਈ ਸਿਫਾਰਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ । ਇਸ ਦਾ ਅੰਤ- ਤੋਂ- ਅੰਤ ਸੰਸਲੇਸ਼ਣ, ਕੁਦਰਤੀ ਪਰੋਸੌਡੀ, ਤੇਜ਼ ਅੰਦਾਜ਼ਾ ਲਗਾਉਣ ਦੀ ਸਮਰੱਥਾ ਇਸ ਨੂੰ ਇਸ ਵਰਤੋਂ ਕੇਸ ਲਈ ਇੱਕ ਵਧੀਆ ਚੋਣ ਬਣਾਉਂਦੀ ਹੈ ।

ਹਾਂ, VITS ਨੂੰ MIT ਅਧੀਨ ਲਾਈਸੈਂਸ ਦਿੱਤੀ ਗਈ ਹੈ, ਜੋ ਕਿ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸਹਾਇਕ ਹੈ। VITS ਆਡੀਓ ਨਾਲ ਬਣਾਈ ਆਡੀਓ ਨੂੰ ਵੀਡਿਓ, ਪੋਡਕਾਸਟ, ਐਪਲੀਕੇਸ਼ਨ, ਖੇਡਾਂ ਅਤੇ ਹੋਰ ਵਪਾਰਕ ਪ੍ਰੋਜੈਕਟਾਂ ਵਿੱਚ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

ਹਾਂ, TTS.ai ਉੱਤੇ ਸਭ ਆਵਾਜ਼ਾਂ ਵਪਾਰਕ-ਲਾਈਸੈਂਸ ਖੋਲ੍ਹੇ-ਸਰੋਤ ਮਾਡਲ (MIT, Apache 2.0) ਵਰਤਦੀਆਂ ਹਨ। ਬਣਾਇਆ ਆਡੀਓ ਤੁਹਾਡੇ ਲਈ ਹੈ, ਜੋ ਕਿ ਵਿਡੀਓ, ਪੋਡਕਾਸਟ, ਐਪਲੀਕੇਸ਼ਨ, ਖੇਡਾਂ ਅਤੇ ਹੋਰ ਵਪਾਰਕ ਐਪਲੀਕੇਸ਼ਨ ਵਿੱਚ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ।

/api/v1/tts/ ਨੂੰ ਮਾਡਲ ਨਾਂ ਅਤੇ ਬੋਲੀ ID ਨਾਲ POST ਬੇਨਤੀ ਭੇਜੋ । ਪਾਈਥਨ, ਜਾਵਾ ਸਕ੍ਰਿਪਟ, ਗੋ ਅਤੇ cURL ਵਿੱਚ ਕੋਡ ਉਦਾਹਰਣਾਂ ਲਈ ਸਾਡਾ API ਡੌਕੂਮੈਂਟੇਸ਼ਨ ਪੇਜ਼ ਵੇਖੋ ।

ਹਾਂ, ਇੱਕ ਨਮੂਨਾ ਸੁਣਨ ਲਈ ਇਸ ਸਫ਼ੇ ਉੱਤੇ ਚਲਾਓ ਬਟਨ ਨੂੰ ਦਬਾਉ । ਤੁਸੀਂ ਪਾਠ ਤੋਂ ਬੋਲੀ ਸਫ਼ੇ ਉੱਤੇ ਪਸੰਦੀਦਾ ਪਾਠ ਵੀ ਲਿਖ ਸਕਦੇ ਹੋ ਅਤੇ ਕਿਸੇ ਵੀ ਬੋਲੀ ਨਾਲ ਮੁਫ਼ਤ ਝਲਕ ਵੀ ਬਣਾ ਸਕਦੇ ਹੋ ।

ਕੋਸ਼ਿਸ Default ਹੁਣ

ਕੋਈ ਵੀ ਟੈਕਸਟ ਲਿਖੋ ਅਤੇ ਸੁਣੋName Default. ਵਰਤਣ ਲਈ ਮੁਫਤ ਕੋਈ ਅੱਖਰ ਲੋੜੀਦਾ ਨਹੀਂ.

ਬੋਲੀ ਬਣਾਓ ਮੁਫਤ ਰਜਿਸਟਰ ਕਰੋ

Default

ਮਾਡਲ ਜਾਣਕਾਰੀ

ਇਸ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਵਰਤੋਂ ਕੇਸ Default

ਆਡੀਓਬੁੱਕਾਂ ਅਤੇ ਗਾਇਨ

ਵਿਡੀਓ ਬੋਲੀ

ਐਪਲੀਕੇਸ਼ਨ ਅਤੇ ਪਹੁੰਚਯੋਗਤਾ

ਈ- ਸਿੱਖਿਆ ਅਤੇ ਟਰੇਨਿੰਗ

ਹੋਰ VITS ਆਵਾਜ਼ਾਂ

CSS10 (Dutch)

CSS10 (Finnish)

CSS10 (French)

CSS10 (German)

CSS10 (Hungarian)

CSS10 (Spanish)

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

VITS TTS ਕੀ ਹੈ?

VITS ਕਿਸ ਨੇ ਵਿਕਸਤ ਕੀਤਾ?

VITS ਕਿਹੜੀਆਂ ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਹਾਇਕ ਹੈ?

VITS ਆਵਾਜ਼ਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਕਿੰਨੀ ਕੀਮਤ ਹੈ?

VITS ਕਿੰਨੀ ਤੇਜ਼ੀ ਨਾਲ ਬੋਲੀ ਪੈਦਾ ਕਰਦਾ ਹੈ?

VITS ਦੀ ਆਡੀਓ ਕੁਆਲਟੀ ਕੀ ਹੈ?

ਕੀ ਮੈਂ VITS ਨਾਲ ਇੱਕ ਆਵਾਜ਼ ਕਲੋਨ ਕਰ ਸਕਦਾ ਹਾਂ?

ਕੀ VITS ਕੁਦਰਤੀ ਬੋਲੀ ਨਾਲ ਆਮ- ਉਦੇਸ਼ ਪਾਠ- ਤੋਂ- ਬੋਲੀ ਲਈ ਢੁੱਕਵਾਂ ਹੈ?

ਕੀ ਮੈਂ VITS ਆਵਾਜ਼ਾਂ ਨੂੰ ਵਪਾਰਕ ਤੌਰ ਉੱਤੇ ਵਰਤ ਸਕਦਾ ਹਾਂ?

ਕੀ ਮੈਂ ਇਹ ਆਵਾਜ਼ ਵਪਾਰਕ ਪ੍ਰੋਜੈਕਟਾਂ ਲਈ ਵਰਤ ਸਕਦਾ ਹਾਂ?

ਮੈਂ API ਰਾਹੀਂ ਇਹ ਆਵਾਜ਼ ਕਿਵੇਂ ਵਰਤਾਂ?

ਕੀ ਮੈਂ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਆਵਾਜ਼ ਦੀ ਝਲਕ ਵੇਖ ਸਕਦੀ ਹਾਂ?

ਕੋਸ਼ਿਸ Default ਹੁਣ